DBpediaDBpedia est un projet universitaire et communautaire d'exploration et extraction automatiques de données dérivées de Wikipédia. Son principe est de proposer une version structurée et normalisée au format du web sémantique des contenus de Wikipedia. DBpedia vise aussi à interconnecter Wikipédia avec d'autres ensembles de données ouvertes provenant du Web des données. DBpedia a été conçu par ses auteurs comme l'un des , connu également sous le nom de Web des données, et l'un de ses possibles points d'entrée.
RDFaRDFa (pour « Resource Description Framework dans des Attributs ») est une recommandation du W3C définissant une syntaxe permettant d'ajouter des données structurées dans une page HTML ou n'importe quel document XML. Ainsi formellement décrites, les données peuvent alors faire l'objet de traitements automatisés complexes, via des outils adaptés. Le code RDFa est invisible pour l'internaute et n'affecte pas ce qui est affiché. RDFa a atteint le statut de recommandation 1.0 le et 1.1 le .
Entity–attribute–value modelAn entity–attribute–value model (EAV) is a data model optimized for the space-efficient storage of sparse—or ad-hoc—property or data values, intended for situations where runtime usage patterns are arbitrary, subject to user variation, or otherwise unforseeable using a fixed design. The use-case targets applications which offer a large or rich system of defined property types, which are in turn appropriate to a wide set of entities, but where typically only a small, specific selection of these are instantated (or persisted) for a given entity.
Machine-readable medium and dataIn communications and computing, a machine-readable medium (or computer-readable medium) is a medium capable of storing data in a format easily readable by a digital computer or a sensor. It contrasts with human-readable medium and data. The result is called machine-readable data or computer-readable data, and the data itself can be described as having machine-readability. Machine-readable data must be structured data. Attempts to create machine-readable data occurred as early as the 1960s.
SPARQLSPARQL (prononcé sparkle, en anglais : « étincelle ») est un langage de requête et un protocole qui permet de rechercher, d'ajouter, de modifier ou de supprimer des données RDF disponibles à travers Internet. Son nom est un acronyme récursif qui signifie SPARQL Protocol and RDF Query Language. SPARQL est considéré dès 2007 comme l'une des technologies clés du Web sémantique par Tim Berners-Lee l'inventeur du Web sémantique qui explique que .
Schema.orgSchema.org est un schéma de micro-données utilisé sur le Web. Les micro-données permettent aux robots d'indexation de saisir plus précisément le sens des pages indexées. Le projet a défini une méthode pour étendre le mécanisme avec de nouvelles propriétés, et une adaptation du schéma au format RDF est disponible. À terme, il est également prévu de supporter plusieurs formats différents en plus des micro-données. Une liste de diffusion permet de coordonner le projet. L'initiative est lancée conjointement par Bing, Google et Yahoo! le .
Triplet RDFLe triplet RDF est la plus petite structure de description de ressources du modèle RDF. C’est une déclaration ou assertion sur une ressource. Cette déclaration RDF est appelée triplet, car elle suit la structure : « sujet - prédicat - objet ». Ainsi, la déclaration RDF Mona Lisa a pour créateur Léonard de Vinci est un triplet : Le triplet RDF comprend trois éléments, sujet, prédicat, objet, conventionnellement écrits dans cet ordre. alt=Sujet → Prédicat → Objet|vignette|414x414px|Schéma du triplet RDF.
YAGOYAGO (Yet Another Great Ontology) est une base de connaissance créée par l'institut Max-Planck d'informatique à Sarrebruck. Elle est constituée à partir d'informations extraites de Wikipédia et d'autres sources. En 2012, YAGO2s, la deuxième version de YAGO, possède d'entités avec plus de d'informations à propos de ces entités. Les connaissances de YAGO sont extraites de Wikipédia (catégories, redirections, infoboxes), de WordNet (synsets, hyponymie), et de GeoNames.
Resource Description FrameworkResource Description Framework (RDF) est un modèle de graphe destiné à décrire formellement les ressources Web et leurs métadonnées, afin de permettre le traitement automatique de telles descriptions. Développé par le W3C, RDF est le langage de base du Web sémantique. L'une des syntaxes (ou sérialisations) de ce langage est RDF/XML. D'autres syntaxes de RDF sont apparues ensuite, cherchant à rendre la lecture plus compréhensible ; c'est le cas par exemple de Notation3 (ou N3).
WikidataWikidata est une base de connaissances librement améliorable, conçue pour centraliser les données utilisées par les différents projets du mouvement Wikimédia. Une mise à jour d'une fiche Wikidata se répercute automatiquement sur toutes les pages de projets Wikimédia qui y font appel. Plus largement, Wikidata est destiné à fournir une source commune de données objectives, telles que les dates de naissance de personnalités ou le produit intérieur brut des pays.