Apprentissage par renforcementEn intelligence artificielle, plus précisément en apprentissage automatique, l'apprentissage par renforcement consiste, pour un agent autonome ( robot, agent conversationnel, personnage dans un jeu vidéo), à apprendre les actions à prendre, à partir d'expériences, de façon à optimiser une récompense quantitative au cours du temps. L'agent est plongé au sein d'un environnement et prend ses décisions en fonction de son état courant. En retour, l'environnement procure à l'agent une récompense, qui peut être positive ou négative.
Algorithme du gradient stochastiqueL'algorithme du gradient stochastique est une méthode de descente de gradient (itérative) utilisée pour la minimisation d'une fonction objectif qui est écrite comme une somme de fonctions différentiables. À la fois l'estimation statistique et l'apprentissage automatique s'intéressent au problème de la minimisation d'une fonction objectif qui a la forme d'une somme : où le paramètre qui minimise doit être estimé. Chacune des fonctions est généralement associée avec la -ème observation de l'ensemble des données (utilisées pour l'apprentissage).
Accès directUn logiciel fait un accès direct (aussi appelé accès aléatoire) à un élément (par exemple, un enregistrement d’un fichier) lorsqu’il écrit ou qu’il lit l’élément en se rendant directement à l’endroit où l’élément doit être écrit ou lu sans écrire ou lire les éléments précédents. Pour accéder directement à l’endroit souhaité, le logiciel utilise un index ou un calcul mathématique qui lui donne l’adresse de l’élément. L’autre type d’accès est l’accès séquentiel.
Recherche dichotomiqueLa recherche dichotomique, ou recherche par dichotomie (), est un algorithme de recherche pour trouver la position d'un élément dans un tableau trié. Le principe est le suivant : comparer l'élément avec la valeur de la case au milieu du tableau ; si les valeurs sont égales, la tâche est accomplie, sinon on recommence dans la moitié du tableau pertinente. Le nombre d'itérations de la procédure, c'est-à-dire le nombre de comparaisons, est logarithmique en la taille du tableau.
Apprentissage par renforcement profondL'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique (par exemple, un robot, un agent conversationnel, un personnage dans un jeu vidéo, etc.) qui apprend à prendre des décisions par essais et erreurs.
Gamme tempéréeDans la théorie de la musique occidentale, la gamme tempérée, gamme au tempérament égal, tempérament égal, est le système d'accord qui divise l'octave en intervalles chromatiques égaux (c'est-à-dire que le rapport des fréquences de deux notes adjacentes est toujours le même). Le plus répandu est un découpage en 12 intervalles. Cependant, il est possible d'en utiliser un nombre différent, dans le but d'obtenir les « tempéraments par division multiple ».
12 equal temperament12 equal temperament (12-ET) is the musical system that divides the octave into 12 parts, all of which are equally tempered (equally spaced) on a logarithmic scale, with a ratio equal to the 12th root of 2 ( ≈ 1.05946). That resulting smallest interval, the width of an octave, is called a semitone or half step. Twelve-tone equal temperament is the most widespread system in music today. It has been the predominant tuning system of Western music, starting with classical music, since the 18th century, and Europe almost exclusively used approximations of it for millennia before that.
Quart de tonEn musique, un quart de ton est un intervalle équivalent (logarithmiquement) à la moitié du demi-ton, ce dernier équivalant à la moitié du ton. Il en résulte qu'on peut altérer les notes avec des demi-dièses ou des demi-bémols. Le quart de ton était utilisé dans certaines échelles de la musique grecque antique. Ce type de quart de ton — appartenant au genre dit enharmonique — est appelé diésis. Son étendue varie selon les théoriciens : 36/35, 28/27, 39/38, 40/39, 31/30, 32/31. Voir Le genre dans la musique de la Grèce antique.
Iterated local searchIterated Local Search (ILS) is a term in applied mathematics and computer science defining a modification of local search or hill climbing methods for solving discrete optimization problems. Local search methods can get stuck in a local minimum, where no improving neighbors are available. A simple modification consists of iterating calls to the local search routine, each time starting from a different initial configuration. This is called repeated local search, and implies that the knowledge obtained during the previous local search phases is not used.