MétadonnéeUne métadonnée (mot composé du préfixe grec meta, indiquant l'auto-référence ; le mot signifie donc proprement « donnée de/à propos de donnée ») est une donnée servant à définir ou décrire une autre donnée, quel qu'en soit le support (papier, électronique ou autre). Un exemple type est d'associer à une donnée la date à laquelle elle a été produite ou enregistrée, ou à une photo les coordonnées géographiques du lieu où elle a été prise. Les métadonnées sont à la base des techniques du Web sémantique.
Filtrage collaboratifvignette|Illustration d'un filtrage collaboratif où un système de recommandation doit prédire l'évaluation d'un objet par un utilisateur en se basant sur les évaluations existantes. Le filtrage collaboratif (de l’anglais : en) regroupe l'ensemble des méthodes qui visent à construire des systèmes de recommandation utilisant les opinions et évaluations d'un groupe pour aider l'individu. Il existe trois principaux axes de recherche dans ce domaine, dépendant chacun des données recueillies sur les utilisateurs du système : le filtrage collaboratif actif ; le filtrage collaboratif passif ; le filtrage basé sur le contenu.
User modelingUser modeling is the subdivision of human–computer interaction which describes the process of building up and modifying a conceptual understanding of the user. The main goal of user modeling is customization and adaptation of systems to the user's specific needs. The system needs to "say the 'right' thing at the 'right' time in the 'right' way". To do so it needs an internal representation of the user. Another common purpose is modeling specific kinds of users, including modeling of their skills and declarative knowledge, for use in automatic software-tests.
PersonnalisationLa personnalisation peut être une action d'ordre matériel (modification impliquant une activité physique sur l'objet) ou phénomène psychologique quasi-anthropologique d'identification d'un artefact à une forme humaine, une personne, une fonction sociale. Dans le langage courant moderne la personnalisation est l'appropriation d'un médium électronique, écrit ou d’un produit de consommation effectuée selon des données personnelles fournies par un usager, ou par la volonté de l'utilisateur lui-même.
Bulle de filtresthumb|right|Eli Pariser a théorisé le concept de la bulle de filtres. La bulle de filtres ou bulle de filtrage (de l’filter bubble) est un concept développé par le militant d'Internet Eli Pariser. Selon Pariser, la « bulle de filtres » désigne à la fois le filtrage de l'information qui parvient à l'internaute par différents filtres ; et l'état d'« isolement intellectuel » et culturel dans lequel il se retrouve quand les informations qu'il recherche sur Internet résultent d'une personnalisation mise en place à son insu.
YouTubeYouTube (en français : ou , en anglais américain : , en anglais standard , en anglais australien ) est un site web d'hébergement de vidéos et média social sur lequel les utilisateurs peuvent envoyer, regarder, commenter, évaluer et partager des vidéos en streaming. Il est créé en par Steve Chen, Chad Hurley et Jawed Karim, trois anciens employés de PayPal. Youtube est racheté par Google en pour de dollars. En 2009, environ de personnes visitent chaque mois le site. En 2020, ce chiffre est passé à .
Production participativeLa production participative, la production par les pairs ou l'externalisation ouverte est l'utilisation du travail, de la créativité, de l'intelligence et du savoir-faire d'un grand nombre de personnes pour réaliser certaines tâches traditionnellement effectuées par un employé ou un entrepreneur. Cela se fait par un appel à un public ciblé (quand un niveau minimal d'expertise est nécessaire) ou par un appel ouvert à un large public. Le travail est éventuellement, mais pas nécessairement, rémunéré.
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
Recherche des plus proches voisinsLa recherche des plus proches voisins, ou des k plus proches voisins, est un problème algorithmique classique. De façon informelle le problème consiste, étant donné un point à trouver, dans un ensemble d'autres points, quels sont les k plus proches. La recherche de voisinage est utilisée dans de nombreux domaines, tels la reconnaissance de formes, le clustering, l'approximation de fonctions, la prédiction de séries temporelles et même les algorithmes de compression (recherche d'un groupe de données le plus proche possible du groupe de données à compresser pour minimiser l'apport d'information).
Recherche d'informationLa recherche d'information (RI) est le domaine qui étudie la manière de retrouver des informations dans un corpus. Celui-ci est composé de documents d'une ou plusieurs bases de données, qui sont décrits par un contenu ou les métadonnées associées. Les bases de données peuvent être relationnelles ou non structurées, telles celles mises en réseau par des liens hypertexte comme dans le World Wide Web, l'internet et les intranets. Le contenu des documents peut être du texte, des sons, des images ou des données.