Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
vignette|upright=1.2|Exemple de clustering hiérarchique. Le partitionnement de données (ou data clustering en anglais) est une méthode en analyse des données. Elle vise à diviser un ensemble de données en différents « paquets » homogènes, en ce sens que les données de chaque sous-ensemble partagent des caractéristiques communes, qui correspondent le plus souvent à des critères de proximité (similarité informatique) que l'on définit en introduisant des mesures et classes de distance entre objets.
vignette|redresse=1.5|Analyse en composantes principales des populations européennes actuelles à partir de et (2009). L’histoire génétique des populations européennes débute au Paléolithique supérieur avec l'arrivée en Europe il y a des hommes modernes venus d'Afrique via le Moyen-Orient. Avec le dernier maximum glaciaire, un effet fondateur se produit, et provoque une augmentation de la pression sélective qui permet à une lignée de prendre de l'ampleur au Mésolithique.
La généalogie génétique est l'application de la génétique à la généalogie. La généalogie génétique nécessite l'usage de tests ADN qui mesurent le niveau de rapports génétiques entre des individus. Les gènes se transmettent entre générations, des comparaisons génétiques permettent d'établir un degré de parenté plus ou moins proche entre individus. thumb|150px| George Darwin, fils de Charles Darwin, fut le premier à estimer la fréquence des mariages entre cousins germains.
Characterizing the genetic structure of large cohorts has become increasingly important as genetic studies extend to massive, increasingly diverse biobanks. Popular methods decompose individual genomes into fractional cluster assignments with each cluster ...
The estimation of genetic clusters using genomic data has application from genome-wide association studies (GWAS) to demographic history to polygenic risk scores (PRS) and is expected to play an important role in the analyses of increasingly diverse, large ...