Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
L'analyse en série de l'expression des gènes (en anglais, Serial Analysis of Gene Expression ou SAGE) est une technique de biologie moléculaire permettant l'analyse de la population en ARNm d'un échantillon donné (organisme, cellules, tissus, etc.). La méthode originelle a été mise au point, et publiée en 1995, par le du centre d'oncologie de l'université Johns-Hopkins. La méthode SAGE est basée sur l'isolation de séquences spécifiques (étiquettes) de chaque ARN, la production des ADN complémentaires (ADNc) correspondant, la production d'une molécule d'ADN synthétique comportant tous ces ADNc, puis le séquençage de cette molécule. Depuis, différentes variations du protocole ont été mises au point, notamment le LongSAGE, permettant l'analyse d'étiquettes plus longues. Les étapes de la méthode SAGE : Isolement des ARNm de l'échantillon à analyser Production des ADNc, en ajoutant un adaptateur à l'extrémité 5', comportant un site de reconnaissance pour l'endonucléase BsmFI. Isolement de petites séquences spécifiques de chaque ADNc, par digestion avec BsmFI Jonction de toutes ces étiquettes pour former des molécules d'ADN synthétiques. Clonage de ces nouvelles séquences dans un vecteur bactérien. Séquençage automatique. Analyse in-silico, pour déterminer le nombre d'occurrences de chaque étiquette dans les échantillons. Le point important de cette méthode est la coupure des ADNc par l'enzyme BsmFI, celle-ci coupe à 15 nucléotides de son site de reconnaissance, libérant donc des petites séquences appelées étiquettes. Les données générées par la méthode SAGE sont des listes d'étiquettes, et le nombre de fois où celles-ci sont identifiées dans l'échantillon. L'interrogation de base de données, permet de relier chaque étiquette à un gène précis. Une analyse statistiques des résultats de différentes expériences permet de déterminer les variations d'expression de chaque gène. Par exemple, la population d'ARNm d'un tissu sain peut être comparée à celle d'une tumeur pour déterminer quels sont les gènes exprimés différemment entre ces deux tissus.
Bart Deplancke, Daniel Migliozzi, Gilles Weder, Riccardo Dainese, Daniel Alpern, Hüseyin Baris Atakan, Mustafa Demir, Dariia Gudkova