Ontology-based data integration involves the use of one or more ontologies to effectively combine data or information from multiple heterogeneous sources. It is one of the multiple data integration approaches and may be classified as Global-As-View (GAV). The effectiveness of ontology‐based data integration is closely tied to the consistency and expressivity of the ontology used in the integration process.
Data from multiple sources are characterized by multiple types of heterogeneity. The following hierarchy is often used:
Syntactic heterogeneity: is a result of differences in representation format of data
Schematic or structural heterogeneity: the native model or structure to store data differ in data sources leading to structural heterogeneity. Schematic heterogeneity that particularly appears in structured databases is also an aspect of structural heterogeneity.
Semantic heterogeneity: differences in interpretation of the 'meaning' of data are source of semantic heterogeneity
System heterogeneity: use of different operating system, hardware platforms lead to system heterogeneity
Ontologies, as formal models of representation with explicitly defined concepts and named relationships linking them, are used to address the issue of semantic heterogeneity in data sources. In domains like bioinformatics and biomedicine, the rapid development, adoption and public availability of ontologies has made it possible for the data integration community to leverage them for semantic integration of data and information.
Ontologies enable the unambiguous identification of entities in heterogeneous information systems and assertion of applicable named relationships that connect these entities together. Specifically, ontologies play the following roles:
Content Explication The ontology enables accurate interpretation of data from multiple sources through the explicit definition of terms and relationships in the ontology.
Query Model In some systems like SIMS, the query is formulated using the ontology as a global query schema.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
(EII) est une approche d'architecture (voire d'urbanisme) permettant d'obtenir une vue unifiée des données informatiques de l'entreprise. En effet, par essence, ces données sont hétérogènes et à échelle de temps différentes. En fonction des choix retenus, aura la possibilité de : modifier les données (et non pas seulement un accès en lecture seule) ; agir en temps réel sur les données (et non pas en différé) ; accéder à des données structurées ; accéder à des données cohérentes ; accéder à des ; remonter des informations jusque dans le (objet) ; accéder au patrimoine .