Topic modelvignette|Visualisation du résumé d'un article scientifique traité par topic model. L'intensité de la couleur varie selon la probabilité d'appartenir au topic en question. En apprentissage automatique et en traitement automatique du langage naturel, un topic model (modèle thématique ou « modèle de sujet ») est un modèle probabiliste permettant de déterminer des sujets ou thèmes abstraits dans un document. Analyse sémantique latente (LSA) Allocation de Dirichlet latente (LDA) Analyse sémantique latente probab
Social bookmarkingalt=Illustration du social bookmarking|vignette|261x261px|Illustration du social bookmarking Le social bookmarking (en français « marque-page social », « navigation sociale » ou bien « partage de signets ») est une façon pour les internautes de stocker, de classer, de chercher et de partager leurs liens favoris. Dans un système ou réseau de bookmarking social, les utilisateurs enregistrent des listes de ressources Web qu’ils trouvent utiles. Ces listes sont accessibles aux utilisateurs d'un réseau ou site web.
Extensible Hypertext Markup LanguageXHTML (Extensible HyperText Markup Language) est un langage de balisage servant à écrire des pages pour le World Wide Web. Conçu à l'origine comme le successeur de HTML, XHTML se fonde sur la syntaxe définie par XML, plus récente et plus simple que celle définie par SGML sur laquelle repose HTML. Il s'agissait en effet à l'époque de tirer parti des bénéfices techniques attendus de la simplification offerte par XML. Comme de nombreux langages fondés sur XML, celui-ci commence par la lettre X, qui représente le mot extensible.
Variable latenteIn statistics, latent variables (from Latin: present participle of lateo, “lie hidden”) are variables that can only be inferred indirectly through a mathematical model from other observable variables that can be directly observed or measured. Such latent variable models are used in many disciplines, including political science, demography, engineering, medicine, ecology, physics, machine learning/artificial intelligence, bioinformatics, chemometrics, natural language processing, management, psychology and the social sciences.
Médecine traditionnelle chinoiseLa médecine traditionnelle chinoise (ou MTC) est l'ensemble des théories et pratiques de santé au cours de l'histoire du monde chinois (aire d'influence de la civilisation chinoise). Au sens large, cette médecine inclut les traditions orales, folkloriques, magiques ou religieuses des différentes ethnies et communautés qui constituent le monde chinois. Dans un sens plus classique, la médecine traditionnelle chinoise est celle qui se réfère à un imposant corpus de textes (tradition écrite), dont les premiers sont datés vers le avant J.
Nuage de mots-clésvignette|Nuage de mots anglais liés au Web 2.0. vignette|Nuage de mots de causes du cancer. Le nuage de mots-clés, ou nuage de tags (en anglais tag cloud, word cloud ou keyword cloud) est une représentation visuelle des mots-clés (tags) les plus utilisés sur un site web. Généralement, les mots s'affichent dans des tailles et graisses de caractères d'autant plus visibles qu'ils sont utilisés ou populaires.
Web Ontology LanguageWeb Ontology Language (OWL) est un langage de représentation des connaissances construit sur le modèle de données de RDF. Il fournit les moyens pour définir des ontologies web structurées. Sa deuxième version est devenue une recommandation du W3C fin 2012. Le langage OWL est basé sur les recherches effectuées dans le domaine de la logique de description.
GéotagUn géotag est un marqueur (« tag », en anglais) à caractère géographique inséré dans des fichiers audio ou raster dans champs (JPEG, , ), IPTC (JPEG/), XMP (très nombreux formats). Le terme en français est « balise de géolocalisation ». Cette balise peut notamment contenir : des données GPS ou GNSS (coordonnées latitude et longitude, une altitude) la direction de vue (boussole) des informations saisies par l'utilisateur : lieux de saisie, code postal...
Système d'information géographiqueUn système d'information géographique ou SIG (en anglais, geographic information system ou GIS) est un système d'information conçu pour recueillir, stocker, traiter, analyser, gérer et présenter tous les types de données spatiales et géographiques. L’acronyme SIG est parfois utilisé pour définir les « sciences de l’information géographique » ou « études sur l’information géospatiale ». Cela se réfère aux carrières ou aux métiers qui impliquent l'usage de systèmes d’information géographique et, dans une plus large mesure, qui concernent les disciplines de la géo-informatique (ou géomatique).
Base de connaissanceUne base de connaissance ou base de connaissances regroupe des connaissances spécifiques à un domaine spécialisé donné, sous une forme exploitable par un ordinateur. Elle peut contenir des règles (dans ce cas, on parle de base de règles), des faits ou d'autres représentations. Si elle contient des règles, un moteur d'inférence peut être utilisé pour déduire de nouveaux faits. Une autre manière de définir une base de connaissance est de dire qu'il s'agit d'une ontologie peuplée par des individus.