Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours se penche sur l'analyse des données génomiques, axée sur les méthodes de regroupement appliquées aux expériences d'expression des gènes cancéreux. Il couvre les étapes de prétraitement, le filtrage des gènes en fonction des valeurs d'expression et la détermination du nombre de clusters. L'instructeur discute de divers algorithmes de regroupement, des mesures de distance et de l'impact des différentes variables sur les résultats de regroupement. En outre, la séance de cours explore l'association des variables avec les amas et les temps de survie, en utilisant les courbes de survie Kaplan-Meier. L'identification des gènes associés à la survie est mise en évidence, ainsi que la signification statistique des coefficients du modèle Cox. Les limites des tests géniques uniques et l'importance d'un suivi attentif dans l'analyse des données sont également abordées, soulignant la nécessité de faire preuve de prudence dans l'interprétation des résultats de l'analyse par grappes.