Une base de données chimiques est une base de données (éventuellement bibliographique) spécifiquement consacrée à l'information chimique. La plupart des bases de données chimiques stockent des informations sur des molécules stables. Les structures chimiques sont traditionnellement représentées dans une représentation de Lewis, qui utilise des lignes pour les liaisons chimiques (paires électroniques) entre atomes, et portées sur papier (formules structurales bidimensionnelles). Bien qu'elles constituent des représentations visuelles adaptées pour le chimiste, elles ne sont pas utilisables pour un usage informatique et plus particulièrement pour la recherche et le stockage.
Les grandes bases de données chimiques devraient être capables d'assurer le stockage et la recherche d'informations sur des millions de molécules (ou autres objets chimiques) sur des téraoctets de mémoire physique.
Il existe deux techniques principales pour représenter les structures chimiques dans les bases numériques :
tables de connexions / matrices d'adjacences / listes avec des informations supplémentaires sur la liaison chimique (arêtes) et données atomiques (nœuds) comme :
PDB, CML
notation linéaire basée sur un parcours en largeur ou un parcours en profondeur :
SMILES/SMARTS, SLN, WLN, InChI
Ces approches ont été raffinées afin de permettre la représentation de différences stéréochimiques, de charges ainsi que des types spéciaux de liaisons comme celles des composés organométalliques. L'avantage principale d'une représentation informatique est la possibilité d'un stockage croissant et d'une recherche rapide et flexible.
Les chimistes peuvent faire une recherche dans les bases en utilisant des parties de structures, des parties des nomenclatures IUPAC ou des contraintes imposées sur les propriétés. Les bases de données chimiques sont particulièrement différentes des autres bases de données plus générales dans leur façon de procéder à la recherche sur des sous-structures.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Explore les structures des acides aminés, la chiralité, les énantiomères et l'activité optique, en soulignant leur importance dans la chimie organique.
Une base de données chimiques est une base de données (éventuellement bibliographique) spécifiquement consacrée à l'information chimique. La plupart des bases de données chimiques stockent des informations sur des molécules stables. Les structures chimiques sont traditionnellement représentées dans une représentation de Lewis, qui utilise des lignes pour les liaisons chimiques (paires électroniques) entre atomes, et portées sur papier (formules structurales bidimensionnelles).
PubChem est une banque de données américaine de molécules chimiques gérée par le National Center for Biotechnology Information (NCBI), branche de la Bibliothèque nationale de médecine des États-Unis sous l'autorité des National Institutes of Health (NIH). PubChem répertorie plusieurs millions de composés en mettant gratuitement en ligne, pour chaque substance, une grande quantité de données de divers ordres : chimique, biochimique, pharmacologique, production, toxicologique, environnemental Des accès aux données de PubChem sont possibles par des langages de script tels que Python, Ruby ou Perl.
L'International Chemical Identifier ou InChI (en français : Identifiant chimique international) est un identifiant textuel pour les substances chimiques, conçu pour être un standard d'encodage des informations moléculaires accessible humainement et pour faciliter la recherche de telles informations dans les bases de données ou sur le web. Initialement développé par l'IUPAC et le NIST de 2000 à 2005, le format et les algorithmes sont non propriétaires.