Concept

Alignement de séquences

En bio-informatique, l'alignement de séquences (ou alignement séquentiel) est une manière de représenter deux ou plusieurs séquences de macromolécules biologiques (ADN, ARN ou protéines) les unes sous les autres, de manière à en faire ressortir les régions homologues ou similaires. L'objectif de l'alignement est de disposer les composants (nucléotides ou acides aminés) pour identifier les zones de concordance. Ces alignements sont réalisés par des programmes informatiques dont l'objectif est de maximiser le nombre de coïncidences entre nucléotides ou acides aminés dans les différentes séquences. Ceci nécessite en général l'introduction de « trous » à certaines positions dans les séquences, de manière à aligner les caractères communs sur des colonnes successives. Ces trous correspondent à des insertions ou des délétions (appelés indel) de nucléotides ou d'acides aminés dans les séquences biologiques. Le résultat final est traditionnellement représenté comme des lignes d'une matrice. thumb|center|upright=2.5|Alignement de séquences de récepteurs nucléaires. Les acides aminés conservés sont surlignés en bleu et en vert. Par endroits, on a inséré des trous, symbolisés par des tirets « - », pour permettre un alignement optimal L'interprétation des alignements des séquences biologiques repose sur la théorie darwinienne de l'évolution. En général les séquences alignées correspondant à des molécules remplissant des fonctions similaires, il peut s'agir par exemple de la même enzyme chez différentes espèces, dont on suppose qu'elles dérivent d'un même ancêtre commun. Les divergences entre les séquences sont interprétées comme résultant de mutations. Les régions contenant des nucléotides ou des acides aminés conservés sont supposées correspondre à des zones où s'exerce une pression de sélection pour maintenir la fonction de la macromolécule. L'alignement a plusieurs utilisations importantes en bioinformatique car il permet un certain nombre de prédictions. Il permet notamment d'identifier des sites fonctionnels (site catalytique, zone d'interaction.

Source officielle

https://fr.wikipedia.org/wiki/Alignement_de_séquences

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Cours associés (25)

BIO-369: Randomness and information in biological data

Biology is becoming more and more a data science, as illustrated by the explosion of available genome sequences. This course aims to show how we can make sense of such data and harness it in order to

BIO-109: Introduction to life sciences (for IC)

Ce cours présente les principes fondamentaux à l'œuvre dans les organismes vivants. Autant que possible, l'accent est mis sur les contributions de l'Informatique aux progrès des Sciences de la Vie.

BIO-378: Physiology lab I

Le TP de physiologie introduit les approches expérimentales du domaine biomédical, avec les montages de mesure, les capteurs, le conditionnement des signaux, l'acquisition et traitement de données. Le

Afficher plus

Séances de cours associées (31)

Algorithme de l'aiguille-Wunsch : Alignement des séquences

Couvre l'algorithme Needleman-Wunsch pour un alignement optimal des séquences protéiques à l'aide de méthodes de programmation et de notation dynamiques.

Éléments logistiques: Mise en œuvre du projet et code fourni

Couvre les éléments logistiques d'un mini-projet et la mise en œuvre du code fourni.

Installation de fenêtre avec Compriband Sealant

Couvre le processus d'installation d'une fenêtre à l'aide d'un scellant compriband.

Afficher plus

Publications associées (32)

Towards improving full-length ribosome density prediction by bridging sequence and graph-based representations

Pierre Vandergheynst, Felix Naef, Cédric Gobet, Francesco Craighero, Mohan Vamsi Nallapareddy

Translation elongation plays an important role in regulating protein concentrations in the cell, and dysregulation of this process has been linked to several human diseases. In this study, we use data from ribo-seq experiments to model ribosome densities, ...

PMLR2024

Benchmarking informatics approaches for virus discovery: caution is needed when combining in silico identification methods

Jaspreet Singh Saini

Understanding the ecological impacts of viruses on natural and engineered ecosystems relies on the accurate identification of viral sequences from community sequencing data. To maximize viral recovery from metagenomes, researchers frequently combine viral ...

Amer Soc Microbiology2024

Opportunities and challenges in design and optimization of protein function

Bruno Emanuel Ferreira De Sousa Correia, Casper Alexander Goverde

The field of protein design has made remarkable progress over the past decade. Historically, the low reliability of purely structure-based design methods limited their application, but recent strategies that combine structure-based and sequence-based calcu ...

Nature Portfolio2024

Afficher plus

Source officielle

https://fr.wikipedia.org/wiki/Alignement_de_séquences

À propos de ce résultat

Cours associés (25)

BIO-369: Randomness and information in biological data

Biology is becoming more and more a data science, as illustrated by the explosion of available genome sequences. This course aims to show how we can make sense of such data and harness it in order to

BIO-109: Introduction to life sciences (for IC)

BIO-378: Physiology lab I

Afficher plus

Séances de cours associées (31)

Algorithme de l'aiguille-Wunsch : Alignement des séquences

Couvre l'algorithme Needleman-Wunsch pour un alignement optimal des séquences protéiques à l'aide de méthodes de programmation et de notation dynamiques.

Éléments logistiques: Mise en œuvre du projet et code fourni

Couvre les éléments logistiques d'un mini-projet et la mise en œuvre du code fourni.

Installation de fenêtre avec Compriband Sealant

Couvre le processus d'installation d'une fenêtre à l'aide d'un scellant compriband.

Afficher plus

Publications associées (32)

Towards improving full-length ribosome density prediction by bridging sequence and graph-based representations

Pierre Vandergheynst, Felix Naef, Cédric Gobet, Francesco Craighero, Mohan Vamsi Nallapareddy

PMLR2024

Benchmarking informatics approaches for virus discovery: caution is needed when combining in silico identification methods

Jaspreet Singh Saini

Amer Soc Microbiology2024

Opportunities and challenges in design and optimization of protein function

Bruno Emanuel Ferreira De Sousa Correia, Casper Alexander Goverde

Nature Portfolio2024

Afficher plus

Personnes associées (2)

Stewart Cole

Professor Stewart Cole is an international authority in bacterial molecular-genetics and genomics. He has made outstanding contributions in several fields including: bacterial anaerobic electron transport; genome analysis of retroviruses and papillomaviruses; antibiotic resistance mechanisms; and the molecular microbiology of toxigenic clostridia. His studies on isoniazid and multidrug resistance in Mycobacterium tuberculosis, together with his pioneering work on the pathogenicity, evolution and genomics of the tubercle and leprosy bacilli, have made him an undisputed leader in the field of mycobacterial research. The findings of his research are of direct relevance to public health and disease-control in both the developing world and the industrialised nations. He has published over 250 scientific papers and review articles, and holds many patents.

Afficher plus

Concepts associés (30)

Séquence conservée

En biologie de l'évolution, les séquences conservées sont des séquences d'acides nucléiques (ADN et ARN) ou d'acide aminés identiques ou similaires au sein d'un génome (on parle alors de séquences paralogues) ; à travers les espèces (on parle alors de séquences orthologues), ou bien encore entre un taxon donneur et un taxon récepteur (on parle alors de séquences xénologues). La conservation indique qu'une séquence a été maintenue par la sélection naturelle.

Prédiction de la structure des protéines

La prédiction de la structure des protéines est l'inférence de la structure tridimensionnelle des protéines à partir de leur séquences d'acides aminés, c'est-à-dire la prédiction de leur pliage et de leur structures secondaire et tertiaire à partir de leur structure primaire. La prédiction de la structure est fondamentalement différente du problème inverse de la conception des protéines. Elle est l'un des objectifs les plus importants poursuivis par la bioinformatique et la chimie théorique.

Multiple sequence alignment

Multiple sequence alignment (MSA) may refer to the process or the result of sequence alignment of three or more biological sequences, generally protein, DNA, or RNA. In many cases, the input set of query sequences are assumed to have an evolutionary relationship by which they share a linkage and are descended from a common ancestor. From the resulting MSA, sequence homology can be inferred and phylogenetic analysis can be conducted to assess the sequences' shared evolutionary origins.

Afficher plus