Base de données biologiques

Les bases de données biologiques sont des bibliothèques répertoriant des informations sur les sciences de la vie collectées grâce à des expériences scientifiques, à la littérature publiée, aux technologies expérimentales à haut débit, et aux analyses informatiques. Elles contiennent des informations venant de divers champs de recherche tels que la génomique, la protéomique, la métabolomique, la phylogénétique et les puces à ADN. Parmi le contenu des bases de données, on trouve des informations à propos de la fonction, de la structure, de la localisation (cellulaire et chromosomique) des gènes et les effets cliniques de leurs mutations, ainsi que leurs similarités de séquence et de structure. Ces bases de données sont des outils importants pour les scientifiques car elles leur permettent de comprendre et expliquer de nombreux phénomènes biologiques allant de la structure des biomolécules et leurs interactions à l'ensemble du métabolisme des organismes, et même l'évolution des espèces. Cette connaissance facilite la prise en charge des pathologies, permet la création de nouveaux médicaments et permet la découverte de relations inter-espèces au cours de l'histoire de la vie. La connaissance en biologie fait l'objet de toutes sortes de bases de données spécialisées ou générales. De ce fait, il est parfois difficile de s'assurer de la consistance des informations. La bioinformatique intégrative a pour objectif de résoudre ce problème en proposant un accès unifié. La notion de numéro d'accession en bioinformatique permet de lier entre eux les contenus des différentes bases de données. Les concepts de base de données relationnelle (venant de l'informatique) et de recherche d'information (sur les bibliothèques électroniques) sont importantes pour la compréhension des bases de données biologiques. Leur conception, leur développement et leur maintenance à long terme est un secteur clé de la bioinformatique. Elles sont souvent décrites comme des données semi-structurées, et peuvent se présenter sous la forme de tableaux, de structures XML, etc.

Graph Chatbot

Benchmarking informatics approaches for virus discovery: caution is needed when combining in silico identification methods

Toward universal cell embeddings: integrating single-cell RNA-seq datasets across species with SATURN

Impact of phylogeny on structural contact inference from protein sequence data

Benchmarking informatics approaches for virus discovery: caution is needed when combining in silico identification methods

Toward universal cell embeddings: integrating single-cell RNA-seq datasets across species with SATURN

Impact of phylogeny on structural contact inference from protein sequence data