DBpediaDBpedia est un projet universitaire et communautaire d'exploration et extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et normalisée au format du web sémantique des contenus de Wikipedia. DBpedia vise aussi à interconnecter Wikipédia avec d'autres ensembles de données ouvertes provenant du Web des données. DBpedia a été conçu par ses auteurs comme l'un des , connu également sous le nom de Web des données, et l'un de ses possibles points d'entrée.
Graphe de connaissancesDans le domaine de la représentation des connaissances, un graphe de connaissances (knowledge graph en anglais) est une base de connaissance modélisant les données sous forme de représentation graphique. Depuis le développement du web sémantique, les graphes de connaissances sont souvent associés aux projets de données ouvertes du web des données, visant surtout à connecter les concepts et entités. Ils sont fortement liés aux et utilisés par les moteurs de recherches, dont certains, tels Google, ont développé leur propre graphe de connaissances.
WiktionnaireLe Wiktionnaire est un projet lexicographique de la Wikimedia Foundation dont l’objectif est de définir tous les mots de toutes les langues, dans toutes les langues. Il existe plus de 150 langues de rédaction. Le terme « Wiktionnaire » désigne la version en français de ce projet, Wiktionary étant le nom officiel en anglais. Il est géré en wiki dans le site web wiktionary.org et son contenu est librement réutilisable (sous licence CC-BY-SA). Daniel Alston (connu sous le pseudonyme Fonzy) est l'un des principaux initiateurs et promoteurs de ce projet.
TriplestoreUn triplestore est une base de données spécialement conçue pour le stockage et la récupération de données RDF (Resource Description Framework). Tout comme une base de données relationnelle, un triplestore stocke des données et il les récupère via un langage de requête. Mais contrairement à une base de données relationnelle, un triplestore ne stocke qu'un seul type de données : le triplet. Elle n'a donc pas besoin de phase d'initialisation pour enregistrer de nouvelles données.
Wikimedia CommonsWikimedia Commons (souvent nommé Commons) est une médiathèque en ligne d's, de sons, d'autres médias audiovisuels et de données JSON sous licence libre. Elle centralise des médias libres, tels que photographies, dessins, schémas, partitions, cartes géographiques, textes écrits et parlés, animations et vidéos, objets 3D qui ont une utilité pour au moins un des projets de Wikimedia. En , elle passe la barre des hébergés.
YAGOYAGO (Yet Another Great Ontology) est une base de connaissance créée par l'institut Max-Planck d'informatique à Sarrebruck. Elle est constituée à partir d'informations extraites de Wikipédia et d'autres sources. En 2012, YAGO2s, la deuxième version de YAGO, possède d'entités avec plus de d'informations à propos de ces entités. Les connaissances de YAGO sont extraites de Wikipédia (catégories, redirections, infoboxes), de WordNet (synsets, hyponymie), et de GeoNames.
Fondation WikimédiaLa Fondation Wikimédia (Wikimedia Foundation, Inc., abrégée en WMF) est une organisation à but non lucratif (foundation 501(c)(3)) régie par les lois de l'État de Floride aux États-Unis chargée de centraliser certains aspects administratifs du mouvement Wikimédia. Son existence a été annoncée le , par Jimmy Wales, cofondateur de Wikipédia. Wikimedia Foundation, Inc.
Base de données orientée grapheUne base de données orientée graphe est une base de données orientée objet utilisant la théorie des graphes, donc avec des nœuds et des arcs, permettant de représenter et stocker les données. Par définition, une base de données orientée graphe correspond à un système de stockage capable de fournir une adjacence entre éléments voisins : chaque voisin d'une entité est accessible grâce à un pointeur physique. C'est une base de données orientée objet adaptée à l'exploitation des structures de données de type graphe ou dérivée, comme des arbres.
WikisourceWikisource est une bibliothèque numérique de textes du domaine public, gérée en wiki grâce au moteur MediaWiki. Comme Wikipédia, elle est hébergée par la fondation Wikimédia et son contenu est librement améliorable. Contrairement aux autres projets Wikimédia, Wikisource ne produit aucun contenu original. Il a pour objet de rendre accessibles de manière plus facile et pérenne des textes déjà publiés par ailleurs. vignette|gauche|Logo d'origine de Wikisource. Le projet a été lancé le .
Resource Description FrameworkResource Description Framework (RDF) est un modèle de graphe destiné à décrire formellement les ressources Web et leurs métadonnées, afin de permettre le traitement automatique de telles descriptions. Développé par le W3C, RDF est le langage de base du Web sémantique. L'une des syntaxes (ou sérialisations) de ce langage est RDF/XML. D'autres syntaxes de RDF sont apparues ensuite, cherchant à rendre la lecture plus compréhensible ; c'est le cas par exemple de Notation3 (ou N3).
Base de connaissanceUne base de connaissance ou base de connaissances regroupe des connaissances spécifiques à un domaine spécialisé donné, sous une forme exploitable par un ordinateur. Elle peut contenir des règles (dans ce cas, on parle de base de règles), des faits ou d'autres représentations. Si elle contient des règles, un moteur d'inférence peut être utilisé pour déduire de nouveaux faits. Une autre manière de définir une base de connaissance est de dire qu'il s'agit d'une ontologie peuplée par des individus.
Mouvement WikimédiaLe mouvement Wikimédia est un mouvement social, international et inter-communautaire, qui a pour mission d'apporter un contenu éducatif gratuit à l'ensemble du monde et dont le projet le plus connu est Wikipédia. Le mot « Wikimedia » est le nom de marque de la Wikimedia Foundation, qui chapeaute le mouvement de façon institutionnelle. Cette fondation a pour mission d'inciter les gens du monde entier à collecter et développer des contenus éducatifs sous licence libre ou dans le domaine public, et à les diffuser efficacement et mondialement.
Web des donnéesLe Web des données (linked data, en anglais) est une initiative du W3C visant à favoriser la publication de données structurées sur le Web, non pas sous la forme de silos de données isolés les uns des autres, mais en les reliant entre elles pour constituer un réseau global d'informations. Il s'appuie sur les standards du Web tels que HTTP et URI. Plutôt qu'utiliser ces standards uniquement pour faciliter la navigation par les êtres humains, le Web des données les étend pour partager l'information également entre machines.
MétadonnéeUne métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, électronique ou autre). Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées géographiques du lieu où elle a été prise. Les métadonnées sont à la base des techniques du Web sémantique.
WikipédiaWikipédia () est une encyclopédie collaborative, généraliste et multilingue créée par Jimmy Wales et Larry Sanger le . Il s'agit d'une œuvre libre, c'est-à-dire que chacun est libre de la rediffuser. Gérée en wiki dans le site web wikipedia.org grâce au logiciel MediaWiki, elle permet à tous les internautes d'écrire et de modifier des articles, ce qui lui vaut d'être qualifiée dencyclopédie participative. Elle est devenue en quelques années l'encyclopédie la plus fournie et la plus consultée au monde.
Wikipédia en anglaisWikipédia en anglais est l’édition de Wikipédia en anglais, langue anglo-frisonne parlée dans de nombreux pays où l'anglais est langue officielle. L'édition est lancée le . Son code . L'encyclopédie en anglais a été lancée le et a atteint trois millions d'articles en . Elle est depuis sa création la plus importante édition de Wikipédia par le nombre d'articles. Elle comptait pour environ 50 % de tous les articles en 2003, mais sa part relative par rapport aux autres éditions a depuis diminué à cause de la croissance des versions dans les autres langues.
MediaWikiMediaWiki est un moteur de wiki pour le Web. Il est utilisé par l’ensemble des projets de la Wikimedia Foundation, des wikis hébergés chez FANDOM, ainsi que par de nombreux autres wikis. Conçu pour répondre aux besoins de Wikipédia, ce moteur est en 2008 également utilisé par des entreprises comme solution de gestion des connaissances et comme système de gestion de contenu. L’entreprise américaine Novell l’utilise notamment pour plusieurs de ses sites web qui véhiculent un trafic important.
Annotation sémantiqueL'annotation sémantique est l'opération consistant à relier le contenu d'un texte à des entités dans une ontologie. Par exemple, pour la phrase «Paris est la capitale de la France.», l'annotation correcte de Paris serait Paris et non Paris Hilton. L'annotation sémantique est une variante plus détaillée mais moins exacte de la méthode des entitiés nommées, car ces dernières décrivent seulement la catégorie de l'entité (Paris est une ville, sans la relier à la bonne page Wikipédia).