Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Les méthodes de maximum de parcimonie, ou plus simplement méthodes de parcimonie ou encore parcimonie de Wagner, sont une méthode statistique non-paramétrique très utilisée, notamment pour l'inférence phylogénétique. Cette méthode permet de construire des arbres de classification hiérarchique après enracinement, lesquels permettent d'obtenir des informations sur la structure de parenté d'un ensemble de taxons. Sous l'hypothèse du maximum de parcimonie, l'arbre phylogénétique « préféré » est celui qui requiert le plus petit nombre de changements évolutifs. Ce mode de regroupement est aussi utilisé en écologie sur du matériel actuel ou fossile, ainsi qu'en synécologie entre autres . La parcimonie appartient à un ensemble de méthodes phylogénétiques fondées sur l'utilisation d'une matrice de caractères discrets qui permet d'inférer un ou plusieurs arbres optimaux pour un jeu de données, un ensemble de taxa donné (traditionnellement un ensemble d'espèces ou des populations isolées reproductivement, au sein d'une même espèce). Ces méthodes ont pour objet d'inférer des topologies phylogénétiques, fondées sur un critère d'optimalité explicite. Un score, est calculé pour chaque arbre et le, ou les arbres possédant les meilleurs scores sont retenus comme ceux fournissant la meilleure, la plus parcimonieuse, estimation des relations phylogénétiques entre les taxa inclus dans l'analyse. Le maximum de parcimonie est utilisé, ou peut être utilisé dans la plupart des analyses phylogénétiques. Jusqu'à une époque récente, c'était la seule méthode utilisée pour l'estimation phylogénétique pour des données morphologiques. L'estimation phylogénétique n'est pas un problème simple. Un nombre exponentiel d'arbres aux topologies différentes est obtenu quand on augmente le nombre de taxa inclus dans l'analyse. Par exemple, plus de trois millions d'arbres non-racinés peuvent être obtenus à partir de dix espèces (10!=). Selon le critère d'optimalité de la parcimonie, c'est-à-dire en cherchant à minimiser le nombre de changements évolutifs, le ou les arbres ajustant (best fit) au mieux les données sont recherchés.
Pascal Fua, Sean Lewis Hill, Jiancheng Yang, Xiang Li, Amos Sironi, Yuchen Wang, Jian Zhou, Jie Zhou, Siqi Liu, Yujie Li