Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les principes fondamentaux de l'analyse par grappes dans le contexte de l'analyse des données génomiques, en mettant l'accent sur des méthodes telles que la classification, le regroupement des données d'expression des gènes, les techniques de visualisation, les mesures de similitude et de dissemblance, les mesures de distance et divers algorithmes de regroupement. L'instructeur explique les défis à relever dans la définition des clusters, l'importance de choisir la bonne mesure de distance et le processus de regroupement hiérarchique et de partitionnement. Des exemples pratiques et des outils comme les paquets R pour les tâches de regroupement sont également discutés, ainsi que des critères pour estimer le nombre de grappes et évaluer la confiance et l'homogénéité des affectations de grappes.