Validation croiséeLa validation croisée () est, en apprentissage automatique, une méthode d’estimation de fiabilité d’un modèle fondée sur une technique d’échantillonnage. Supposons posséder un modèle statistique avec un ou plusieurs paramètres inconnus, et un ensemble de données d'apprentissage sur lequel on peut apprendre (ou « entraîner ») le modèle. Le processus d'apprentissage optimise les paramètres du modèle afin que celui-ci corresponde le mieux possible aux données d'apprentissage.
Isomérie cis-transEn chimie organique, les préfixes cis et trans servent à préciser la configuration géométrique d'une molécule en spécifiant si, par rapport à la chaine principale de la molécule décrite, les principaux groupes fonctionnels sont situés du même côté (cis-, « ensemble » en latin) ou au contraire de part et d'autre (trans-, « à travers » en latin). Les deux configurations cis- et trans- sont donc diastéréoisomères. Pour la détermination cis/trans, la priorité des substituants est définie selon leur encombrement stérique, et non selon la nomenclature Cahn-Ingold-Prelog.
ConformérieEn chimie, la conformérie est une forme de stéréoisomérie décrivant le fait qu'une même molécule existe sous la forme de plusieurs conformères (ou isomères de conformation) à la suite de la rotation des atomes autour de liaisons chimiques simples. On parle surtout de conformérie en chimie organique, pour des rotations autour des liaisons carbone-carbone. Il existe trois principaux facteurs qui rendent certains conformères plus stables que les autres : L'interaction entre une liaison σ et le lobe orbital arrière d'une liaison σ∗ voisine : cela n'est possible que lorsque les deux liaisons sont décalées.
Jeux d'entrainement, de validation et de testEn apprentissage automatique, une tâche courante est l'étude et la construction d'algorithmes qui peuvent apprendre et faire des prédictions sur les données. De tels algorithmes fonctionnent en faisant des prédictions ou des décisions basées sur les données, en construisant un modèle mathématique à partir des données d'entrée. Ces données d'entrée utilisées pour construire le modèle sont généralement divisées en plusieurs jeux de données .