Opinion miningEn informatique, l'opinion mining (aussi appelé sentiment analysis) est l'analyse des sentiments à partir de sources textuelles dématérialisées sur de grandes quantités de données (big data). Ce procédé apparait au début des années 2000 et connait un succès grandissant dû à l'abondance de données provenant de réseaux sociaux, notamment celles fournies par Twitter. L'objectif de l’opinion mining est d'analyser une grande quantité de données afin d'en déduire les différents sentiments qui y sont exprimés.
TwitterTwitter ( en anglais), rebaptisé progressivement X depuis le , est un réseau social de microblogage. Il permet à un utilisateur d’envoyer gratuitement des micromessages limités à , appelés tweets ou gazouillis par messagerie instantanée ou par SMS. Twitter est créé le par Jack Dorsey, Evan Williams, Biz Stone et Noah Glass. Le service en ligne est rapidement devenu populaire. Le , il compte d’utilisateurs actifs par mois, de tweets envoyés par jour et est disponible en plus de quarante langues.
Smileyvignette|redresse=.4|Un smiley. Un smiley (de l’anglais smile, « sourire »), une frimousse ou une binette, est un dessin extrêmement stylisé d'un visage souriant, coloré en jaune, exprimant l’amitié. Par extension, le terme est employé pour désigner d’autres visages, pas nécessairement jaunes ni souriants. Sur Internet, ces images sont habituellement employées pour exprimer des émotions et peuvent donc être qualifiées d’émoticônes graphiques dans ces situations. Ils sont souvent représentés avec les symboles du clavier.
Messagerie textevignette|Un message texte par SMS - la limite de 160 caractères a conduit aux abréviations de « langage SMS ». La messagerie texte, ou texto, est l'acte de composer et d'envoyer des messages électroniques, généralement composés de caractères alphabétiques et numériques, entre deux ou plusieurs utilisateurs de dispositifs mobiles, d'ordinateurs de bureau/portables ou d'autres types d'ordinateurs compatibles. Les messages textuels peuvent être envoyés sur un réseau cellulaire, ou peuvent également être envoyés via une connexion Internet.
Émoticônevignette|redresse=.4|Émoticône cœur symbolisant l'amour. Une émoticône est une petite représentation graphique stylisée et symbolique d'une émotion, d'un état d'esprit, d'un ressenti ou d'une ambiance, utilisée dans un message écrit et informatisé (courrier électronique ou texto). Cette figuration est née de la combinaison de plusieurs caractères typographiques, comme le smiley « :-) », mais le terme désigne aussi une petite image – pouvant être fixe ou animée – telle que « 20px|Clin d'œil.
ÉmojiUn est un pictogramme utilisé dans un message électronique ou une page web. Le mot emoji signifie littéralement « image » (e) + « lettre » (moji) ; la ressemblance avec « émotion » est un jeu de mots interculturel. Ces caractères sont utilisés de la même façon que les émoticônes ASCII, mais un plus grand nombre est défini. Les icônes sont standardisées et intégrées aux appareils.
Classification et catégorisation de documentsLa classification et catégorisation de documents est l'activité du traitement automatique des langues naturelles qui consiste à classer de façon automatique des ressources documentaires, généralement en provenance d'un corpus. Cette classification peut prendre une infinité de formes. On citera ainsi la classification par genre, par thème, ou encore par opinion. La tâche de classification est réalisée avec des algorithmes spécifiques, mis en œuvre par des systèmes de traitement de l'information.
Contenu généré par les utilisateursLe contenu généré par les utilisateurs (CGU, en anglais user-generated content, ou UGC) fait référence à un ensemble de « contenus », c'est-à-dire des documents de différents types, comme des images, des vidéos, des textes ou des audios, qui sont destinés à la télédiffusion. Ces contenus sont directement créés ou modifiés par les utilisateurs des plateformes en ligne. Le CGU s'oppose aux contenus médiatisés par les entreprises de média traditionnelles, dans lesquelles le public n'intervient pas en tant qu'acteur de la production ou de la télédiffusion.
Vérification des faitsvignette|Un atelier de rédaction dans une école de journalisme à São Paulo, Brésil, en 2016. La vérification des faits est une technique consistant d'une part à vérifier la véracité des faits et l'exactitude des chiffres présentés dans les médias par des personnes publiques, notamment des personnalités politiques et des experts, et, d'autre part, à évaluer le niveau d'objectivité des médias eux-mêmes dans leur traitement de l'information.
Mueller reportThe Mueller report, officially titled Report On The Investigation Into Russian Interference In The 2016 Presidential Election, is the official report documenting the findings and conclusions of former Special Counsel Robert Mueller's investigation into Russian efforts to interfere in the 2016 United States presidential election, allegations of conspiracy or coordination between Donald Trump's presidential campaign and Russia, and allegations of obstruction of justice.
Multimodal sentiment analysisMultimodal sentiment analysis is a technology for traditional text-based sentiment analysis, which includes modalities such as audio and visual data. It can be bimodal, which includes different combinations of two modalities, or trimodal, which incorporates three modalities. With the extensive amount of social media data available online in different forms such as videos and images, the conventional text-based sentiment analysis has evolved into more complex models of multimodal sentiment analysis, which can be applied in the development of virtual assistants, analysis of YouTube movie reviews, analysis of news videos, and emotion recognition (sometimes known as emotion detection) such as depression monitoring, among others.
MotUn mot est une suite de sons ou de caractères graphiques formant une unité sémantique et pouvant être distingués par un séparateur, par exemple un blanc typographique à l'écrit. En linguistique, un mot est le plus petit élément pouvant être prononcé isolément avec un contenu sémantique ou pragmatique. « Mot » dérive du bas-latin muttum, substantif issu du verbe latin muttire. Ce verbe indique généralement la production d'un discours inarticulé et/ou incohérent : au sens propre, muttire, c'est dire « mu », grogner comme un bovin.
Forum (informatique)vignette|Un forum En informatique, un forum est un espace de discussion publique (ou au moins ouvert à plusieurs participants). Les discussions y sont archivées ce qui permet une communication asynchrone (c'est ce qui différencie les forums de la messagerie instantanée). Il y a deux sortes de forum, en fonction du classement des messages : soit les « forums de discussion » dont les messages sont classés par date chronologique, soit les « forums de questions / réponses » dont les messages sont classés par votes.
LiveJournalvignette LiveJournal (souvent abrégé en LJ) est une communauté virtuelle dont les utilisateurs peuvent tenir un blogue ou un journal. C'est aussi le nom du logiciel libre conçu pour matérialiser les échanges communautaires. Les principales différences entre LiveJournal et les autres sites de blogues sont ses caractéristiques de communauté autonome et de réseau social analogues à celles de Friendster et MySpace par exemple. LiveJournal a été créé en 1999 par Brad Fitzpatrick pour rester en contact avec ses amis de lycée.