VCardvCard est un format standard ouvert d'échange de données personnelles (Visit Card soit Carte de visite). La version 4.0 de 2011 de vCard est définie par les RFC 6350 et 6868. La version précédente est le vCard 3.0 de 1998. Les différences entre ces formats sont exposées en Annexe de la RFC. L'un ou l'autre de ces formats sont utilisés par le logiciel Carnet d'adresses d'Apple ou encore les logiciels de courrier électronique comme Mozilla Thunderbird ou Outlook Express.
RDFaRDFa (pour « Resource Description Framework dans des Attributs ») est une recommandation du W3C définissant une syntaxe permettant d'ajouter des données structurées dans une page HTML ou n'importe quel document XML. Ainsi formellement décrites, les données peuvent alors faire l'objet de traitements automatisés complexes, via des outils adaptés. Le code RDFa est invisible pour l'internaute et n'affecte pas ce qui est affiché. RDFa a atteint le statut de recommandation 1.0 le et 1.1 le .
MétadonnéeUne métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, électronique ou autre). Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées géographiques du lieu où elle a été prise. Les métadonnées sont à la base des techniques du Web sémantique.
RDF SchemaRDF Schema ou RDFS (acronyme de Resource Description Framework Schema) est un langage extensible de représentation des connaissances. Il appartient à la famille des langages du Web sémantique publiés par le W3C. RDFS fournit des éléments de base pour la définition d'ontologies ou vocabulaires destinés à structurer des ressources RDF, ces derniers pouvant être stockés dans des bases relationnelles appelées triplestores et manipulés à l'aide des requêtes en langage SPARQL.
Web scrapingLe web scraping, parfois appelé harvesting ou en français moissonnage, est une technique d'extraction des données de sites Web par l'utilisation d'un script ou d'un programme dans le but de les transformer et les réutiliser dans un autre contexte comme l'enrichissement de bases de données, le référencement ou l'exploration de données. Aux États-Unis, la société hiQ Labs utilise le web scraping sur les données de LinkedIn à des fins de recrutement.
Schema.orgSchema.org est un schéma de micro-données utilisé sur le Web. Les micro-données permettent aux robots d'indexation de saisir plus précisément le sens des pages indexées. Le projet a défini une méthode pour étendre le mécanisme avec de nouvelles propriétés, et une adaptation du schéma au format RDF est disponible. À terme, il est également prévu de supporter plusieurs formats différents en plus des micro-données. Une liste de diffusion permet de coordonner le projet. L'initiative est lancée conjointement par Bing, Google et Yahoo! le .
Machine-readable medium and dataIn communications and computing, a machine-readable medium (or computer-readable medium) is a medium capable of storing data in a format easily readable by a digital computer or a sensor. It contrasts with human-readable medium and data. The result is called machine-readable data or computer-readable data, and the data itself can be described as having machine-readability. Machine-readable data must be structured data. Attempts to create machine-readable data occurred as early as the 1960s.
Extensible Hypertext Markup LanguageXHTML (Extensible HyperText Markup Language) est un langage de balisage servant à écrire des pages pour le World Wide Web. Conçu à l'origine comme le successeur de HTML, XHTML se fonde sur la syntaxe définie par XML, plus récente et plus simple que celle définie par SGML sur laquelle repose HTML. Il s'agissait en effet à l'époque de tirer parti des bénéfices techniques attendus de la simplification offerte par XML. Comme de nombreux langages fondés sur XML, celui-ci commence par la lettre X, qui représente le mot extensible.
Tag (métadonnée)Un tag (ou étiquette, marqueur, libellé) est un mot-clé (signifiant) ou terme associé ou assigné à de l'information (par exemple une , un article, ou un clip vidéo), qui décrit une caractéristique de l'objet et permet un regroupement facile des informations contenant les mêmes mots-clés. Les tags sont habituellement choisis de façon personnelle par l'auteur/créateur ou l'utilisateur de l'objet ; ils ne font souvent pas partie d'un schéma de classification prédéfini.
Web sémantiquevignette|300px|droite|Logo du W3C pour le Web sémantique Le Web sémantique, ou toile sémantique, est une extension du Web standardisée par le World Wide Web Consortium (W3C). Ces standards encouragent l'utilisation de formats de données et de protocoles d'échange normés sur le Web, en s'appuyant sur le modèle Resource Description Framework (RDF). Le Web sémantique est par certains qualifié de Web 3.0. Selon le W3C, . L'expression a été inventée par Tim Berners-Lee (inventeur du Web et directeur du W3C), qui supervise le développement des technologies communes du Web sémantique.