Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur le concept de régression robuste dans le contexte de l'analyse des données génomiques, en mettant l'accent sur les observations de pondération avec des résidus importants afin d'améliorer la précision de l'estimation. Diverses fonctions de perte de poids sont discutées, y compris la fonction de perte de Huber. La séance de cours se penche également sur l'utilisation d'estimateurs M et de l'algorithme itératif des moindres carrés (IRLS) pour une estimation de régression robuste. Les applications pratiques d'une régression robuste dans l'analyse des données de micropuces, la détection aberrante et l'évaluation de la qualité des mesures d'expression des gènes sont explorées à l'aide d'exemples et de pseudo-images. Les paramètres d'évaluation de la qualité, tels que NUSE et RLE, sont expliqués, ce qui permet de comprendre la qualité des puces et l'erreur de mesure de l'expression. La séance de cours se termine par une discussion sur les différentes mesures d'évaluation de la qualité et leur mise en œuvre dans les outils d'analyse des données génomiques.