Robot d'indexationalt=Architecture d'un robot d'indexation|vignette|270x270px|Architecture d'un robot d'indexation Un robot d'indexation (en anglais web crawler ou web spider, littéralement araignée du Web) est un logiciel qui explore automatiquement le Web. Il est généralement conçu pour collecter les ressources (pages Web, , vidéos, documents Word, PDF ou PostScript, etc.), afin de permettre à un moteur de recherche de les indexer.
User-Agent headerIn computing, the User-Agent header is an HTTP header intended to identify the user agent responsible for making a given HTTP request. Whereas the character sequence User-Agent comprises the name of the header itself, the header value that a given user agent uses to identify itself is colloquially known as its user agent string. The user agent for the operator of a computer used to access the Web has encoded within the rules that govern its behavior the knowledge of how to negotiate its half of a request-response transaction; the user agent thus plays the role of the client in a client–server system.
Service webUn service web (ou service de la toile) est un protocole d'interface informatique de la famille des technologies web permettant la communication et l'échange de données entre applications et systèmes hétérogènes dans des environnements distribués. Il s'agit donc d'un ensemble de fonctionnalités exposées sur internet ou sur un intranet, par et pour des applications ou machines, sans intervention humaine, de manière synchrone ou asynchrone. Le protocole de communication est défini dans le cadre de la norme SOAP dans la signature du service exposé (WSDL).
Web Hypertext Application Technology Working GroupLe Web Hypertext Application Technology Working Group (ou WHATWG) est une collaboration non officielle des différents développeurs de navigateurs web ayant pour but le développement de nouvelles technologies destinées à faciliter l'écriture et le déploiement d'applications à travers le Web. La liste de diffusion du groupe de travail est publique et ouverte à tous. La Mozilla Foundation, Opera Software et Apple en sont les premiers contributeurs, rejoints en 2017 par Google et Microsoft.
Type de médiasUn type de médias (media type en anglais), à l'origine (et toujours communément) appelé type MIME, est un identifiant de format de données sur internet en deux parties. Les types de médias étaient à l'origine définis dans la (publiée en ) pour leur utilisation dans les courriels à travers le protocole SMTP, mais ils ont été étendus à d'autres protocoles comme le HTTP ou le SIP dans la (publiée en ). Un type de médias est composé d'au moins deux parties : un type et un sous-type structuré en arbre avec un suffixe optionnel, et de paramètres optionnels : type "/" [arbre ".
Machine-readable medium and dataIn communications and computing, a machine-readable medium (or computer-readable medium) is a medium capable of storing data in a format easily readable by a digital computer or a sensor. It contrasts with human-readable medium and data. The result is called machine-readable data or computer-readable data, and the data itself can be described as having machine-readability. Machine-readable data must be structured data. Attempts to create machine-readable data occurred as early as the 1960s.
Greater-than signThe greater-than sign is a mathematical symbol that denotes an inequality between two values. The widely adopted form of two equal-length strokes connecting in an acute angle at the right, , has been found in documents dated as far back as 1631. In mathematical writing, the greater-than sign is typically placed between two values being compared and signifies that the first number is greater than the second number. Examples of typical usage include 1.5 > 1 and 1 > −2. The less-than sign and greater-than sign always "point" to the smaller number.
Obsolescence (informatique)L'obsolescence est, dans le domaine du développement logiciel, la situation où une ancienne fonctionnalité est considérée comme dépassée au regard d'un nouveau standard, et où, bien qu'elle soit conservée dans les versions plus récentes (par souci de rétro-compatibilité, et pour donner aux développeurs le temps de mettre leur code source en conformité), elle pourrait disparaître à l'avenir, si bien qu'il est recommandé d'en abandonner l'usage. De telles fonctionnalités sont recensées dans la documentation, mais leur statut est explicitement mentionné.
MicroformatUn microformat (parfois abrégé sous μF ou uF) est une approche de formatage de données dans des pages WEB, qui cherche à rationaliser et standardiser le contenu existant, comme les métadonnées, en utilisant des classes et attributs de balises XHTML et HTML. Cette approche est conçue pour permettre à l'information destinée aux utilisateurs finaux, telle que le carnet d'adresses, les coordonnées géographiques, les numéros de téléphone, les événements et autres données ayant une structure constante, d'être traitée automatiquement par les logiciels.
AgrégateurUn agrégateur est une entité qui regroupe plusieurs grandeurs ou flux en un seul. Dans le domaine informatique, un logiciel agrégateur tresse plusieurs fils de syndication en même temps. Il prévient de la mise à jour de sites web ou des actualités qu'ils publient et importe le contenu nouveau en question. Dans le domaine de l'énergie, un agrégateur désigne un opérateur économique spécialisé dans l'agrégation d'effacement de consommation électrique.