Virtual communityA virtual community is a social network of individuals who connect through specific social media, potentially crossing geographical and political boundaries in order to pursue mutual interests or goals. Some of the most pervasive virtual communities are online communities operating under social networking services. Howard Rheingold discussed virtual communities in his book, The Virtual Community, published in 1993. The book's discussion ranges from Rheingold's adventures on The WELL, computer-mediated communication, social groups and information science.
Communauté en ligneUne communauté en ligne désigne « un groupement d’individus ayant des intérêts communs et interagissant entre eux, autour d’une activité particulière, par le biais de dispositifs sociotechniques connectés par le réseau internet » . Le terme « en ligne » signifie que les membres interagissent via internet. Le terme « communauté virtuelle » (virtual community) est attribué au livre du même nom publié en 1993 et écrit par Howard Rheingold.
Contenu généré par les utilisateursLe contenu généré par les utilisateurs (CGU, en anglais user-generated content, ou UGC) fait référence à un ensemble de « contenus », c'est-à-dire des documents de différents types, comme des images, des vidéos, des textes ou des audios, qui sont destinés à la télédiffusion. Ces contenus sont directement créés ou modifiés par les utilisateurs des plateformes en ligne. Le CGU s'oppose aux contenus médiatisés par les entreprises de média traditionnelles, dans lesquelles le public n'intervient pas en tant qu'acteur de la production ou de la télédiffusion.
Partitionnement de donnéesvignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
K-moyennesLe partitionnement en k-moyennes (ou k-means en anglais) est une méthode de partitionnement de données et un problème d'optimisation combinatoire. Étant donnés des points et un entier k, le problème est de diviser les points en k groupes, souvent appelés clusters, de façon à minimiser une certaine fonction. On considère la distance d'un point à la moyenne des points de son cluster ; la fonction à minimiser est la somme des carrés de ces distances.
Flickren, de l'anglais en « feuilleter », est un site web de partage de photographies et de vidéos gratuit, avec certaines fonctionnalités payantes. En plus d'être un site web populaire auprès des utilisateurs pour partager leurs photos personnelles, il est aussi souvent utilisé par des photographes professionnels. En août 2011, le site a franchi la barre des 6 milliards de photos hébergées. En février 2017, le site héberge approximativement 13 milliards de photos pour 122 millions de membres et 2 millions de groupes.
Correlation clusteringClustering is the problem of partitioning data points into groups based on their similarity. Correlation clustering provides a method for clustering a set of objects into the optimum number of clusters without specifying that number in advance. Cluster analysis In machine learning, correlation clustering or cluster editing operates in a scenario where the relationships between the objects are known instead of the actual representations of the objects.
Système de gestion de contenualt=Exemple de design du système de gestion de contenu WorldPress|vignette|293x293px|Exemple de design du système de gestion de contenu WordPress Un système de gestion de contenu ou SGC (content management system ou CMS en anglais) est un programme informatique permettant de créer un site internet, un blogue ou encore un site de vente en ligne. Les fonctionnalités d'un SGC sont nombreuses. Il permet entre autres de travailler à plusieurs sur un même document ; de séparer les opérations de gestion de la forme et du contenu ; de structurer le contenu (FAQ, documents, blogues, forums, etc.
Clustering high-dimensional dataClustering high-dimensional data is the cluster analysis of data with anywhere from a few dozen to many thousands of dimensions. Such high-dimensional spaces of data are often encountered in areas such as medicine, where DNA microarray technology can produce many measurements at once, and the clustering of text documents, where, if a word-frequency vector is used, the number of dimensions equals the size of the vocabulary.
Determining the number of clusters in a data setDetermining the number of clusters in a data set, a quantity often labelled k as in the k-means algorithm, is a frequent problem in data clustering, and is a distinct issue from the process of actually solving the clustering problem. For a certain class of clustering algorithms (in particular k-means, k-medoids and expectation–maximization algorithm), there is a parameter commonly referred to as k that specifies the number of clusters to detect.