Anchor textThe anchor text, link label or link text is the visible, clickable text in an HTML hyperlink. The term "anchor" was used in older versions of the HTML specification for what is currently referred to as the a element, or . The HTML specification does not have a specific term for anchor text, but refers to it as "text that the a element wraps around". In XML terms (since HTML is XML), the anchor text is the content of the element, provided that the content is text. Usually, web search engines analyze anchor text from hyperlinks on web pages.
Annuaire webUn annuaire web, répertoire web, annuaire Internet ou répertoire Internet est un site web proposant une liste classée de sites Web. Le classement se fait typiquement dans une arborescence de catégories, censée couvrir tout ou partie des centres d'intérêt des visiteurs. Chaque catégorie contient des sous-catégories concernant des aspects plus pointus d'un sujet donné et des hyperliens vers les sites agrémentés d'une description.
Recherche d'informationLa recherche d'information (RI) est le domaine qui étudie la manière de retrouver des informations dans un corpus. Celui-ci est composé de documents d'une ou plusieurs bases de données, qui sont décrits par un contenu ou les métadonnées associées. Les bases de données peuvent être relationnelles ou non structurées, telles celles mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet et les intranets. Le contenu des documents peut être du texte, des sons, des images ou des données.
Yahoo! SearchYahoo! Search is a Yahoo! internet search provider that uses Microsoft's Bing search engine to power results, since 2009, apart from four years with Google from 2015 until the end of 2018. Originally, "Yahoo! Search" referred to a Yahoo!-provided interface that sent queries to a searchable index of pages supplemented with its directory of websites. The results were presented to the user under the Yahoo! brand. Originally, none of the actual web crawling and data housing was done by Yahoo! itself.
Yahoo!Yahoo! est une société américaine de services web créée en 1994, appartenant, entre 2017 et 2021 à Verizon Media et, désormais, à Apollo Global Management. Son siège social est situé à Sunnyvale en Californie. À l'origine, Yahoo! était uniquement un annuaire Web, créé par David Filo et Jerry Yang à l'université Stanford en janvier 1994, puis l'entreprise a été fondée en . Selon Alexa Internet, Yahoo! était le site web le plus visité en 2004. Le réseau des sites Yahoo! a servi plus de trois milliards de pages par jour en .
Élément metaUn élément meta (ou métaélément, ou balise meta, ou meta tag par analogie avec l’anglais) est une information qui porte sur la nature et le contenu d’une page web, ajoutée dans l’en-tête de la page au moyen de marqueurs HTML. L’élément meta est un type d’élément HTML (comme l’élément link...) destiné à fournir des métadonnées structurées sur une page web. Cet élément doit être placé dans la section head d’un document HTML, entre les marques et . Il est invisible à la lecture et peut avoir diverses utilisations.
Video search engineA video search engine is a web-based search engine which crawls the web for video content. Some video search engines parse externally hosted content while others allow content to be uploaded and hosted on their own servers. Some engines also allow users to search by video format type and by length of the clip. The video search results are usually accompanied by a thumbnail view of the video. Video search engines are computer programs designed to find videos stored on digital devices, either through Internet servers or in storage units from the same computer.
Robot d'indexationalt=Architecture d'un robot d'indexation|vignette|270x270px|Architecture d'un robot d'indexation Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, , vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.
World Wide Webvignette|Logo historique du World Wide Web par Robert Cailliau. vignette|Où la toile est née, plaque commémorant la création du World Wide Web dans les locaux du CERN. Le World Wide Web ( ; littéralement la « toile (d’araignée) mondiale », abrégé www ou le Web), la toile mondiale ou la toile, est un système hypertexte public fonctionnant sur Internet. Le Web permet de consulter, avec un navigateur, des pages accessibles sur des sites. L’image de la toile d’araignée vient des hyperliens qui lient les pages web entre elles.
Image retrievalAn image retrieval system is a computer system used for browsing, searching and retrieving images from a large database of digital images. Most traditional and common methods of image retrieval utilize some method of adding metadata such as captioning, keywords, title or descriptions to the images so that retrieval can be performed over the annotation words. Manual image annotation is time-consuming, laborious and expensive; to address this, there has been a large amount of research done on automatic image annotation.
Microsoft BingMicrosoft Bing (anciennement Bing, Live Search, Windows Live Search et MSN Search), est un moteur de recherche élaboré par la société Microsoft. Il a été rendu public le . Au moment de sa sortie, en 2008, cela révélait un changement dans la stratégie commerciale de Microsoft, qui séparait son moteur de recherche de sa suite d’applications Windows Live. Dans sa version finale, Bing offre les options de recherches suivantes : sites web, images, vidéos, shopping, actualités, cartes, voyages...
Pertinence d'un documentUne recherche scientifique ne peut avoir cette qualité de « scientifique » qu’après avoir répondu à un ensemble de critères. Parmi ces critères, la pertinence occupe une place primordiale, elle constitue la moelle épinière de toute recherche académique. En effet, c’est le degré de la pertinence qui donne beaucoup de crédibilité à un tel document. Par elle ce dernier aura beaucoup de chance d’être publiée et d’être tenue comme référence scientifique de recherche.
Hyperlienalt=Hyperlien wikipedia|vignette|Pointeur de souris en forme de main au-dessus d'un hyperlien « Wikipedia ». Un hyperlien ou lien hypertexte, est une référence placée dans le contenu d'un document électronique permettant de passer automatiquement d'un document consulté à un autre document ou à une autre partie du même document. Il prend la plupart du temps la forme d'un texte souligné en bleu, mais peut également être placé sur une photographie, une image, un bouton, notamment.
ExciteExcite est une collection de sites et services Web, lancée en décembre 1993. excite est un service en ligne offrant une variété de contenu, y compris un portail Internet montrant des nouvelles, la météo, un moteur de recherche, un webmail, une messagerie instantanée, des cotations boursières, et une page d'accueil personnalisable. Le contenu est assemblé à partir de plus de 100 sources différentes. Le portail et les services excite sont la propriété de Excite Networks, mais aux États-Unis, excite est un portail personnalisable, appelé My Excite, qui est exploité par Mindspark et détenu par IAC Search and Media.
Portail webUn portail web est un site web qui offre une porte d'entrée commune à un large éventail de ressources et de services accessibles sur Internet et centrés sur un domaine d'intérêt ou une communauté particulière. Les ressources et services dont l'accès est ainsi rassemblé peuvent être des sites ou des pages web, des forums de discussion, des adresses de courrier électronique, espaces de publication, moteur de recherche, etc.
Lien retourUn lien retour (aussi appelé lien entrant ou lien arrivant ; en anglais, inbound link, inlink ou backlink) est un hyperlien pointant vers un site ou une page Web. La qualité du lien retour et le nombre de liens retour pointant vers un site ou une page fournissent une indication de la réputation de ce site ou de cette page. Plus précisément, un lien retour correspond à n'importe quel lien reçu par un nœud du Web (page Web, annuaire, site Internet, ou Domaine de premier niveau) depuis un autre nœud du Web.
Web trafficWeb traffic is the data sent and received by visitors to a website. Since the mid-1990s, web traffic has been the largest portion of Internet traffic. Sites monitor the incoming and outgoing traffic to see which parts or pages of their site are popular and if there are any apparent trends, such as one specific page being viewed mostly by people in a particular country. There are many ways to monitor this traffic, and the gathered data is used to help structure sites, highlight security problems or indicate a potential lack of bandwidth.
Recherche d'image par le contenuLa recherche d'image par le contenu (en anglais : content-based image retrieval ou CBIR) est une technique permettant de rechercher des images à partir de ses caractéristiques visuelles, c'est-à-dire induite de leurs pixels. Les images sont classiquement décrites comme rendant compte de leur texture, couleur, forme. Un cas typique d'utilisation est la recherche par l'exemple où l'on souhaite retrouver des images visuellement similaires à un exemple donné en requête.
Serveur webvignette|Serveurs de la Wikimedia Foundation. Un serveur web est soit un logiciel de service de ressources web (serveur HTTP), soit un serveur informatique (ordinateur) qui répond à des requêtes du World Wide Web sur un réseau public (Internet) ou privé (intranet), en utilisant principalement le protocole HTTP. Un serveur informatique peut être utilisé à la fois pour servir des ressources du Web et pour faire fonctionner en parallèle d'autres services liés, comme l'envoi de courriers électroniques, l'émission de flux en streaming, le stockage de données dans des bases de données, le transfert de fichiers par .
BaiduBaidu () est une entreprise Internet chinoise. Son moteur de recherche en chinois peut chercher du texte et des images. En , c'est le site le plus consulté de Chine et, en 2019, c'est le le plus consulté sur Internet. Baidu signifie « Cent degrés » en chinois. L'entreprise propose un index de plus de 740 millions de pages web, 80 millions d'images et 10 millions de fichiers multimédia. Elle participe activement à la communauté du logiciel libre, notamment dans le domaine de l'intelligence artificielle.