ChIP-SeqLe séquençage ChIP-Seq, également connu en tant que séquençage ChIP, est une méthode utilisée pour analyser les interactions entre protéines et l'ADN. Le ChIP-Seq est une technique permettant d’étudier les interactions ADN/protéine à l’échelle du génome. Il s'agit d'une approche basée sur une technique innovante de séquençage qui permet de déterminer rapidement la séquence des fragments immunoprécipités par immunoprécipitation de chromatine (ChIP). Cette technique, dite de ChIP-Seq, fut publiée en 2007 par l’équipe du Prof.
GèneUn gène, du grec ancien (« génération, naissance, origine »), est, en biologie, une séquence discrète et héritable de nucléotides dont l'expression affecte les caractères d'un organisme. L'ensemble des gènes et du matériel non codant d'un organisme constitue son génome. Un gène possède donc une position donnée dans le génome d'une espèce, on parle de locus génique. La séquence est généralement formée par des désoxyribonucléotides, et est donc une séquence d'ADN (par des ribonucléotides formant de l'ARN dans le cas de certains virus), au sein d'un chromosome.
Phylogénétique moléculairevignette|Séquençage moléculaire La phylogénétique moléculaire est l'utilisation de séquences de macromolécules biologiques pour obtenir des informations sur l'histoire évolutive des organismes vivants, et notamment sur leurs liens de parenté (leur phylogénie). C'est un important outil d'étude parmi ceux de l'évolution moléculaire. Le produit d'une analyse de phylogénétique moléculaire est soit un arbre phylogénétique, soit un graphe du réseau phylogénétique.
GénomeLe génome (//), ou plus rarement génôme, est l'ensemble du matériel génétique d'une espèce codé dans son acide désoxyribonucléique (ADN), à l'exception de certains virus dont le génome est constitué d'acide ribonucléique (ARN). Il contient en particulier tous les gènes codant des protéines ou correspondant à des ARN structurés. Il se décompose donc en séquences codantes (transcrites en ARN messagers et traduites en protéines) et non codantes (non transcrites, ou transcrites en ARN, mais non traduites).
Nucléosomevignette|Schéma de trois nucléosomes mis bout à bout, formant une partie d'un nucléofilament de 11 nm. Le nucléosome est un complexe comportant un segment d’ADN de 146 ou 147 paires de nucléotides, enroulé autour d'un cœur formé de protéines (les histones). Chez les eucaryotes, le nucléosome constitue l’unité de base d'organisation de la chromatine. Il représente le premier niveau de compaction de l’ADN dans le noyau, on compare souvent sa géométrie à celle d'un fil enroulé autour d'une bobine.
Régulation de l'expression des gènesLa régulation de l'expression des gènes désigne l'ensemble de mécanismes mis en œuvre pour passer de l'information génétique incluse dans une séquence d'ADN à un produit de gène fonctionnel (ARN ou protéine). Elle a pour effet de moduler, d'augmenter ou de diminuer la quantité des produits de l'expression des gènes (ARN, protéines). Toutes les étapes allant de la séquence d'ADN au produit final peuvent être régulées, que ce soit la transcription, la maturation des ARNm, la traduction des ARNm ou la stabilité des ARNm et protéines.
Facteur de transcriptionvignette|upright=2.2|Schéma simplifié du mécanisme d'un activateur. Un facteur de transcription est une protéine nécessaire à l'initiation ou à la régulation de la transcription d'un gène dans l'ensemble du vivant (procaryote ou eucaryote). Elle interagit avec l'ADN et l'ARN-polymérase. Il existe une classification complexe des facteurs de transcription. Les facteurs généraux de la transcription, impliqués dans la composition de la machinerie transcriptionnelle basale organisée autour de l'ARN polymérase II.
ÉpigénomiqueL’épigénomique est l'étude de l'ensemble des modifications épigénétiques d'une cellule.Les modifications épigénétiques sont réversibles dans l'ADN de la cellule ou les histones. Ceci affecte l'expression des gènes altérant la séquence d'ADN (Russell 2010 p. 475). Deux des modifications épigénétiques les plus caractéristiques sont: la méthylation de l'ADN et les modifications par les histones. Les modifications épigénétiques jouent un rôle important dans l'expression et la régulation des gènes et sont impliquées dans un nombre de processus cellulaires comme dans la différentiation/ le développement et la tumorigenèse.
Data PreprocessingData preprocessing can refer to manipulation or dropping of data before it is used in order to ensure or enhance performance, and is an important step in the data mining process. The phrase "garbage in, garbage out" is particularly applicable to data mining and machine learning projects. Data collection methods are often loosely controlled, resulting in out-of-range values, impossible data combinations, and missing values, amongst other issues. Analyzing data that has not been carefully screened for such problems can produce misleading results.
Classification phylogénétiqueLa classification phylogénétique ou classification cladistique est une forme de classification des êtres vivants qui repose sur leur phylogénie. Elle prend son origine dans les travaux d'une école de taxonomie dite systématique phylogénétique ou systématique cladistique ou cladisme. Cette approche a pour objectif de rendre compte des relations de parenté entre les taxons, s’agissant seulement de l'apparentement, c'est-à-dire des relations de groupes frères et non des relations généalogiques d'ancêtres à descendants, entre des groupes d'organismes quel que soit leur rang taxonomique.