Web des donnéesLe Web des données (linked data, en anglais) est une initiative du W3C visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations. Il s'appuie sur les standards du Web tels que HTTP et URI. Plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines.
WikidataWikidata est une base de connaissances librement améliorable, conçue pour centraliser les données utilisées par les différents projets du mouvement Wikimédia. Une mise à jour d'une fiche Wikidata se répercute automatiquement sur toutes les pages de projets Wikimédia qui y font appel. Plus largement, Wikidata est destiné à fournir une source commune de données objectives, telles que les dates de naissance de personnalités ou le produit intérieur brut des pays.
Watson (intelligence artificielle)vignette|redresse=1.2|Un prototype initial de Watson en 2011. Watson est un programme informatique d'intelligence artificielle conçu par la société IBM dans le but de répondre à des questions formulées en langage naturel. Il s'intègre dans un programme de développement plus vaste, le DeepQA research project. Le nom « Watson » fait référence à Thomas J. Watson, dirigeant d'IBM de 1914 à 1956, avant même que cette société ne s'appelle ainsi.
BabelNetBabelNet est un réseau sémantique multilingue et une ontologie lexicalisée. BabelNet a été créé en intégrant automatiquement la plus grande encyclopédie multilingue – c’est-à-dire Wikipédia – avec le lexique de la langue anglaise le plus connu – WordNet. L’intégration a été réalisée par correspondance automatique. Les entrées manquantes dans d'autres langues ont été obtenues par des techniques de traduction automatique.
Graphe de connaissancesDans le domaine de la représentation des connaissances, un graphe de connaissances (knowledge graph en anglais) est une base de connaissance modélisant les données sous forme de représentation graphique. Depuis le développement du web sémantique, les graphes de connaissances sont souvent associés aux projets de données ouvertes du web des données, visant surtout à connecter les concepts et entités. Ils sont fortement liés aux et utilisés par les moteurs de recherches, dont certains, tels Google, ont développé leur propre graphe de connaissances.
WiktionnaireLe Wiktionnaire est un projet lexicographique de la Wikimedia Foundation dont l’objectif est de définir tous les mots de toutes les langues, dans toutes les langues. Il existe plus de 150 langues de rédaction. Le terme « Wiktionnaire » désigne la version en français de ce projet, Wiktionary étant le nom officiel en anglais. Il est géré en wiki dans le site web wiktionary.org et son contenu est librement réutilisable (sous licence CC-BY-SA). Daniel Alston (connu sous le pseudonyme Fonzy) est l'un des principaux initiateurs et promoteurs de ce projet.
Fondation WikimédiaLa Fondation Wikimédia (Wikimedia Foundation, Inc., abrégée en WMF) est une organisation à but non lucratif (foundation 501(c)(3)) régie par les lois de l'État de Floride aux États-Unis chargée de centraliser certains aspects administratifs du mouvement Wikimédia. Son existence a été annoncée le , par Jimmy Wales, cofondateur de Wikipédia. Wikimedia Foundation, Inc.
Freebase (web)Freebase est un projet collaboratif libre de rassemblement et de connexion des connaissances du web, sous forme sémantique déployé sur le Web entre 2007 et 2014. Il est diffusé sous licence Creative Commons avec attribution. Freebase structure fortement les documents. Son développement s’appuie sur des utilisateurs pour alimenter cette base de connaissance, établir les liens entre entités et catégoriser les informations. Dès son origine, Freebase établit des liens vers Wikipedia.
YAGOYAGO (Yet Another Great Ontology) est une base de connaissance créée par l'institut Max-Planck d'informatique à Sarrebruck. Elle est constituée à partir d'informations extraites de Wikipédia et d'autres sources. En 2012, YAGO2s, la deuxième version de YAGO, possède d'entités avec plus de d'informations à propos de ces entités. Les connaissances de YAGO sont extraites de Wikipédia (catégories, redirections, infoboxes), de WordNet (synsets, hyponymie), et de GeoNames.
CycCyc est un projet d’intelligence artificielle (« IA ») qui cherche à développer une ontologie globale et une base de connaissance générale, dans le but de permettre à des applications d’intelligence artificielle de raisonner d’une manière similaire à l’être humain. Le projet a été lancé en 1984 par Douglas Lenat, de la société Microelectronics and Computer Technology Corporation. Le nom « Cyc » (dérivé de « encyclopédie », et prononcé saïk, est une marque déposée par Cycorp, Inc.
Requête sémantiqueLes requêtes sémantiques permettent des interrogations et des analyses de nature associative et contextuelle. Elles permettent d'extraire des informations dérivant d'éléments syntaxiques, sémantiques et structurelles contenues dans les données. Elles sont conçues pour : fournir des résultats précis, telles que la sélection distinctive d'un seul élément d'information ; répondre à des questions plus floues et ouvertes grâce au filtrage de motifs et aux systèmes basés sur le raisonnement.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).
WikipédiaWikipédia () est une encyclopédie collaborative, généraliste et multilingue créée par Jimmy Wales et Larry Sanger le . Il s'agit d'une œuvre libre, c'est-à-dire que chacun est libre de la rediffuser. Gérée en wiki dans le site web wikipedia.org grâce au logiciel MediaWiki, elle permet à tous les internautes d'écrire et de modifier des articles, ce qui lui vaut d'être qualifiée dencyclopédie participative. Elle est devenue en quelques années l'encyclopédie la plus fournie et la plus consultée au monde.
Resource Description FrameworkResource Description Framework (RDF) est un modèle de graphe destiné à décrire formellement les ressources Web et leurs métadonnées, afin de permettre le traitement automatique de telles descriptions. Développé par le W3C, RDF est le langage de base du Web sémantique. L'une des syntaxes (ou sérialisations) de ce langage est RDF/XML. D'autres syntaxes de RDF sont apparues ensuite, cherchant à rendre la lecture plus compréhensible ; c'est le cas par exemple de Notation3 (ou N3).
WordNetWordNet est une base de données lexicale développée par des linguistes du laboratoire des sciences cognitives de l'université de Princeton depuis une vingtaine d'années. Son but est de répertorier, classifier et mettre en relation de diverses manières le contenu sémantique et lexical de la langue anglaise. Des versions de WordNet pour d'autres langues existent, mais la version anglaise est cependant la plus complète à ce jour. La base de données ainsi que des outils sont disponibles gratuitement.
Web Ontology LanguageWeb Ontology Language (OWL) est un langage de représentation des connaissances construit sur le modèle de données de RDF. Il fournit les moyens pour définir des ontologies web structurées. Sa deuxième version est devenue une recommandation du W3C fin 2012. Le langage OWL est basé sur les recherches effectuées dans le domaine de la logique de description.