Assemblage (bio-informatique)En bio-informatique, l'assemblage consiste à aligner et/ou fusionner des fragments d'ADN ou d'ARN issus d'une plus longue séquence afin de reconstruire la séquence originale. Il s'agit d'une étape d'analyse in silico qui succède au séquençage de l'ADN ou de l'ARN d'un organisme unique, d'une colonie de clones (bactériens par exemple), ou encore d'un mélange complexe d'organismes. Le problème de l'assemblage peut être comparé à celui de la reconstruction du texte d'un livre à partir de plusieurs copies de celui-ci, préalablement déchiquetées en petits morceaux.
Taille du génomevignette|Arbre phylogénétique indiquant la taille des génomes chez les organismes des trois domaines du monde vivant: les bactéries Bacteria (en bleu), les archées Archaea (en vert) et les eucaryotes Eucarya (en rouge). La taille du génome correspond à la quantité d'ADN contenue dans une copie d'un génome. La taille d'un génome est également appelée valeur C.
Expression génétiqueL'expression des gènes, encore appelée expression génique ou expression génétique, désigne l'ensemble des processus biochimiques par lesquels l'information héréditaire stockée dans un gène est lue pour aboutir à la fabrication de molécules qui auront un rôle actif dans le fonctionnement cellulaire, comme les protéines ou les ARN. Même si toutes les cellules d'un organisme partagent le même génome, certains gènes ne sont exprimés que dans certaines cellules, à certaines périodes de la vie de l'organisme ou sous certaines conditions.
Évolution moléculaireL'évolution moléculaire ou évolution du génome correspond à l'ensemble des modifications d ́un génome au cours de générations successives au sein d'une population. C'est le moteur de l'évolution des espèces. L ́étude de l ́évolution moléculaire des génomes tente d'expliquer les changements biologiques au niveau moléculaire et cellulaire. Ceci met en jeu plusieurs disciplines telles que la biologie moléculaire, la génétique, la génomique et la bio-informatique.
Gène chevauchantEn génétique, un gène est dit chevauchant s'il est superposé, partiellement ou totalement, à un autre gène et exprime une protéine différente de ce dernier. Il peut s'agir de séquences codantes superposées transcrites avec un décalage du cadre de lecture, de l'expression du brin d'ADN complémentaire de la région codante d'un autre gène, de gènes exprimés chacun sur un brin d'ADN complémentaire et qui ne se superposent qu'à leur extrémité 3', voire d'un gène inclus dans l'intron d'un autre gène.
Paléopolyploïdiedroite|vignette|300px|Paléopolyploïdie chez les eucaryotes, d'après Wolfe (2001), Adams & Wendel (2005), Cui (2006). La paléopolyploïdie fait référence à une polyploïdie ancestrale survenue il y a plusieurs millions d'années à la suite d'une duplication complète du génome par autopolyploïdie ou bien allopolyploïdie. Cette duplication du génome donne un organisme avec 4n lots de chromosomes ou plus. Cet état est transitoire car en raison de la redondance fonctionnelle des gènes, les gènes (ohnologues) sont rapidement éteints ou massivement éliminés par le phénomène de fractionnement des génomes.
Algorithmethumb|Algorithme de découpe d'un polygone quelconque en triangles (triangulation). Un algorithme est une suite finie et non ambiguë d'instructions et d’opérations permettant de résoudre une classe de problèmes. Le domaine qui étudie les algorithmes est appelé l'algorithmique. On retrouve aujourd'hui des algorithmes dans de nombreuses applications telles que le fonctionnement des ordinateurs, la cryptographie, le routage d'informations, la planification et l'utilisation optimale des ressources, le , le traitement de textes, la bio-informatique L' algorithme peut être mis en forme de façon graphique dans un algorigramme ou organigramme de programmation.
GénomiqueLa génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du génome, au lieu de se limiter à l'échelle d'un seul gène. La génomique se divise en deux branches : La génomique structurale, qui se charge du séquençage du génome entier ; La génomique fonctionnelle, qui vise à déterminer la fonction et l'expression des gènes séquencés en caractérisant le transcriptome et le protéome. La génomique est l'équivalent de la métabolomique pour les métabolites.
Métagénomiquevignette|300px|À titre d'exemple : Indices comparés de biodiversité pour 19 métagénomes marins échantillonnés par l'expédition , tels qu'analysés avec GenGIS. La métagénomique ou génomique environnementale est une méthode d'étude du contenu génétique d'échantillons issus d'environnements complexes (ex : intestin, océan, sols, air, etc.) prélevés dans la nature (par opposition à des échantillons cultivés en laboratoire).
Distance de LevenshteinLa 'distance de Levenshtein' est une distance, au sens mathématique du terme, donnant une mesure de la différence entre deux chaînes de caractères. Elle est égale au nombre minimal de caractères qu'il faut supprimer, insérer ou remplacer pour passer d’une chaîne à l’autre. Elle a été proposée par Vladimir Levenshtein en 1965. Elle est également connue sous les noms de distance d'édition ou de déformation dynamique temporelle, notamment en reconnaissance de formes et particulièrement en reconnaissance vocale.