Recherche plein texteLa recherche (en) plein texte (appelée aussi recherche en texte intégral ou recherche de texte libre) est une technique de recherche dans un document électronique ou une base de données textuelles, qui consiste pour le moteur de recherche à examiner tous les mots de chaque document enregistré et à essayer de les faire correspondre à ceux fournis par l'utilisateur. Les techniques de recherche sont devenues fréquentes dans les bases de données bibliographiques en ligne dans les années 1970.
RéférencementLe référencement est l'action de référencer, c'est-à-dire mentionner quelque chose ou y faire référence. Ce terme est utilisé dans deux contextes bien spécifiques : Dans la grande distribution lors de la gestion de catalogues produits : les produits sont référencés dans les étalages. De même, des services peuvent être référencés comme prestataires potentiels. Sur Internet, le travail de référencement consiste à améliorer le positionnement et la visibilité de sites dans des pages de résultats de moteurs de recherche ou d'annuaires.
SwiftypeSwiftype is a search and index company based in San Francisco, California, that provides search software for organizations, websites, and computer programs. Notable customers include AT&T, Dr. Pepper, Hubspot and TechCrunch. Swiftype was founded in 2012 by Matt Riley and Quin Hoxie. The company participated in Y Combinator’s incubator program and received investment from a number of prominent sources. Their site search uses semantic understanding of queries to differentiate the meaning of words based on their use.
Search engineA search engine is a software system that finds web pages that match a web search. They search the World Wide Web in a systematic way for particular information specified in a textual web search query. The search results are generally presented in a line of results, often referred to as search engine results pages (SERPs). The information may be a mix of hyperlinks to web pages, images, videos, infographics, articles, and other types of files. Some search engines also mine data available in databases or open directories.
Enterprise searchEnterprise search is the practice of making content from multiple enterprise-type sources, such as databases and intranets, searchable to a defined audience. "Enterprise search" is used to describe the software of search information within an enterprise (though the search function and its results may still be public). Enterprise search can be contrasted with web search, which applies search technology to documents on the open web, and desktop search, which applies search technology to the content on a single computer.
RacinisationEn linguistique, la racinisation ou désuffixation est un procédé de transformation des flexions en leur radical ou racine. La racine d’un mot correspond à la partie du mot restante une fois que l’on a supprimé son (ses) préfixe(s) et suffixe(s), à savoir son radical. Contrairement au lemme qui correspond à un terme issu de l’usage ordinaire des locuteurs de la langue, la racine ne correspond généralement qu’à un terme résultant de ce type d’analyse.
Mot cléUn mot clé (orthographié aussi mot-clé, mot clef ou mot-clef) est un mot ou un groupe de mots utilisé pour caractériser le contenu d’un document et permettre une recherche d'informations. Une liste de mots clés permet ainsi de préciser les thématiques du document. Dans le cadre de la recherche d'informations, les termes de recherche sont autant que possible convertis en mots clés au moyen d'un thésaurus documentaire correspondant à la manière dont sont indexés les documents.
MétadonnéeUne métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, électronique ou autre). Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées géographiques du lieu où elle a été prise. Les métadonnées sont à la base des techniques du Web sémantique.
Vocabulaire contrôléUn vocabulaire contrôlé est un lexique dont le but est de rendre possible l'organisation des connaissances afin d'optimiser la recherche d'information. Le vocabulaire contrôlé est utilisé dans les schémas servant à l'indexation sujet, les vedettes-matières, les thésaurus et les taxinomies. Un vocabulaire contrôlé impose l'utilisation de termes prédéfinis, qui ont été présélectionnés par le concepteur du vocabulaire. Ils s'opposent donc au langage naturel, où aucune restriction n'existe quant au choix du vocabulaire.
Élément metaUn élément meta (ou métaélément, ou balise meta, ou meta tag par analogie avec l’anglais) est une information qui porte sur la nature et le contenu d’une page web, ajoutée dans l’en-tête de la page au moyen de marqueurs HTML. L’élément meta est un type d’élément HTML (comme l’élément link...) destiné à fournir des métadonnées structurées sur une page web. Cet élément doit être placé dans la section head d’un document HTML, entre les marques et . Il est invisible à la lecture et peut avoir diverses utilisations.