DonnéeUne donnée est ce qui est connu et qui sert de point de départ à un raisonnement ayant pour objet la détermination d'une solution à un problème en relation avec cette donnée. Cela peut être une description élémentaire qui vise à objectiver une réalité, le résultat d'une comparaison entre deux événements du même ordre (mesure) soit en d'autres termes une observation ou une mesure. La donnée brute est dépourvue de tout raisonnement, supposition, constatation, probabilité.
Big dataLe big data ( « grosses données » en anglais), les mégadonnées ou les données massives, désigne les ressources d’informations dont les caractéristiques en termes de volume, de vélocité et de variété imposent l’utilisation de technologies et de méthodes analytiques particulières pour créer de la valeur, et qui dépassent en général les capacités d'une seule et unique machine et nécessitent des traitements parallélisés. L’explosion quantitative (et souvent redondante) des données numériques permet une nouvelle approche pour analyser le monde.
Science des donnéesLa science des données est l'étude de l’extraction automatisée de connaissance à partir de grands ensembles de données. Plus précisément, la science des données est un domaine interdisciplinaire qui utilise des méthodes, des processus, des algorithmes et des systèmes scientifiques pour extraire des connaissances et des idées à partir de nombreuses données structurées ou non . Elle est souvent associée aux données massives et à l'analyse des données.
Jeux d'entrainement, de validation et de testEn apprentissage automatique, une tâche courante est l'étude et la construction d'algorithmes qui peuvent apprendre et faire des prédictions sur les données. De tels algorithmes fonctionnent en faisant des prédictions ou des décisions basées sur les données, en construisant un modèle mathématique à partir des données d'entrée. Ces données d'entrée utilisées pour construire le modèle sont généralement divisées en plusieurs jeux de données .
Analyse des donnéesL’analyse des données (aussi appelée analyse exploratoire des données ou AED) est une famille de méthodes statistiques dont les principales caractéristiques sont d'être multidimensionnelles et descriptives. Dans l'acception française, la terminologie « analyse des données » désigne donc un sous-ensemble de ce qui est appelé plus généralement la statistique multivariée. Certaines méthodes, pour la plupart géométriques, aident à faire ressortir les relations pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données.
Genre artistiqueLe genre artistique, dans les arts et lettres, est une classification typologique des œuvres, qui se distingue du (littéraire, architectural ou autre), ainsi que du (littéraire, musical ou autre) et se réfère à un ensemble traditionnel de caractéristiques matérielles, formelles et finales. Cette typologie est généralement associée à un ordre de valeur, comme c'est le cas dans les beaux-arts avec la hiérarchie des genres.
Reconnaissance automatique de la parolevignette|droite|upright=1.4|La reconnaissance vocale est habituellement traitée dans le middleware ; les résultats sont transmis aux applications utilisatrices. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la voix humaine captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine.
Modèle de donnéesEn informatique, un modèle de données est un modèle qui décrit la manière dont sont représentées les données dans une organisation métier, un système d'information ou une base de données. Le terme modèle de données peut avoir deux significations : Un modèle de données théorique, c'est-à-dire une description formelle ou un modèle mathématique. Voir aussi modèle de base de données Un modèle de données instance, c'est-à-dire qui applique un modèle de données théorique (modélisation des données) pour créer un modèle de données instance.
Entrepôt de donnéesvignette|redresse=1.5|Vue d'ensemble d'une architecture entrepôt de données. Le terme entrepôt de données ou EDD (ou base de données décisionnelle ; en anglais, data warehouse ou DWH) désigne une base de données utilisée pour collecter, ordonner, journaliser et stocker des informations provenant de base de données opérationnelles et fournir ainsi un socle à l'aide à la décision en entreprise. Un entrepôt de données est une base de données regroupant une partie ou l'ensemble des données fonctionnelles d'une entreprise.
Genre cinématographiqueLe genre cinématographique permet de catégoriser les films en fonction de leurs thèmes. Les catégories cinématographiques peuvent chacune être divisée en genres particuliers dont les plus communs sont : le film d'action, qui mise sur l'enchainement des péripéties ; le film d'aventures, qui, à l'inverse du film d'action, ne s'intéresse pas aux péripéties en elles-mêmes, mais aux circonstances qui les amènent ; le film d'anticipation, dont l'action se déroule dans un futur proche ou plus lointain.
Genre littéraireLe genre littéraire est un système de classement des productions littéraires selon leur contenu, par exemple : le roman d'aventure, le journal intime, le théâtre de boulevard, ou selon leur registre, par exemple : fantastique, tragique, comique. Le genre littéraire recoupe les genres pictural, narratif et dramatique. Divers critères pouvant se combiner et se chevaucher pour déterminer des catégories secondaires, la liste des genres n’étant en effet pas close.
Language developmentLanguage development in humans is a process starting early in life. Infants start without knowing a language, yet by 10 months, babies can distinguish speech sounds and engage in babbling. Some research has shown that the earliest learning begins in utero when the fetus starts to recognize the sounds and speech patterns of its mother's voice and differentiate them from other sounds after birth. Typically, children develop receptive language abilities before their verbal or expressive language develops.
Gestion des donnéesLa gestion des données est une discipline de gestion qui tend à valoriser les données en tant que ressources numériques. La gestion des données permet d'envisager le développement d'architectures, de réglementations, de pratiques et de procédures qui gèrent correctement les besoins des organismes sur le plan de tout le cycle de vie des données. Les données sont, avec les traitements, l'un des deux aspects des systèmes d'information traditionnellement identifiés, et l'un ne peut aller sans l'autre pour un management du système d'information cohérent.
Multilinguismethumb|right|Le logo de la Confédération suisse, dont l’allemand, le français, l'italien et le romanche sont les quatre langues nationales thumb|Enseigne multilingue à l’aéroport international de Vancouver. Texte en anglais, français et chinois affiché de façon permanente, tandis que le panneau de droite est un écran qui montre d’autres langues à tour de rôle. Le mot multilinguisme (ainsi que plurilinguisme) décrit le fait qu'une communauté, ou une personne, soit multilingue (ou plurilingue), c'est-à-dire qu'elle soit capable de s'exprimer dans plusieurs langues.
Origine du langageL’origine du langage humain a toujours suscité l’intérêt des penseurs. De nombreux mythes tendent à donner aux langues une origine surnaturelle. La Bible explique ainsi la multiplicité des langues par le mythe de la Tour de Babel, selon lequel la langue unique des origines aurait été divisée en une multitude de langues pour apporter la discorde entre les hommes et les empêcher de se concerter en vue d'une action commune.
Exploration de donnéesL’exploration de données, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, data mining, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
LangageLe langage est la capacité d'exprimer une pensée et de communiquer au moyen d'un système de signes (vocaux, gestuel, graphiques, tactiles, olfactifs, etc.) doté d'une sémantique, et le plus souvent d'une syntaxe — mais ce n'est pas systématique (la cartographie est un exemple de langage non syntaxique). Fruit d'une acquisition, la langue est une des nombreuses manifestations du langage. Les langages sont constitués de signaux correspondant au support physique de l'information.
Alternance codiqueL’alternance codique (de l'anglais code switching) désigne l’alternance entre plusieurs codes linguistiques (langues, dialectes ou registres de langue) au sein d’un même et unique discours ou énoncé, voire au sein d’une phrase, le plus souvent là où les syntaxes des deux codes s'alignent (Codique DGCP). On parle d’alternance codique seulement lorsqu’il est produit par des multilingues parlant couramment leurs langues.
Genre fictionGenre fiction, also known as formula fiction or popular fiction, is a term used in the book-trade for fictional works written with the intent of fitting into a specific literary genre in order to appeal to readers and fans already familiar with that genre. A number of major literary figures have written genre fiction. John Banville publishes crime novels as Benjamin Black, and both Doris Lessing and Margaret Atwood have written science fiction.
Data wranglingData wrangling, sometimes referred to as data munging, is the process of transforming and mapping data from one "raw" data form into another format with the intent of making it more appropriate and valuable for a variety of downstream purposes such as analytics. The goal of data wrangling is to assure quality and useful data. Data analysts typically spend the majority of their time in the process of data wrangling compared to the actual analysis of the data.