Résumé
Dans la théorie des probabilités et la théorie de l'information, l'information mutuelle de deux variables aléatoires est une quantité mesurant la dépendance statistique de ces variables. Elle se mesure souvent en bit. L'information mutuelle d'un couple de variables représente leur degré de dépendance au sens probabiliste. Ce concept de dépendance logique ne doit pas être confondu avec celui de causalité physique, bien qu'en pratique l'un implique souvent l'autre. Informellement, on dit que deux variables sont indépendantes si la réalisation de l'une n'apporte aucune information sur la réalisation de l'autre. Le coefficient de corrélation est une mesure du cas particulier de dépendance dans lequel la relation entre les deux variables est strictement linéaire. L'information mutuelle est nulle si et seulement si les variables sont indépendantes, et croit lorsque la dépendance augmente. Soit un couple de variables aléatoires de densité de probabilité jointe données par (on fait, dans cet article, l'abus de notation pour représenter la probabilité de l'événement ). On note les distributions marginales et . Alors l'information mutuelle est dans le cas discret : et, dans le cas continu : où , et sont respectivement les densités des lois de , et . L'information mutuelle dans le cas d'une distribution gaussienne s'écrit sous la forme suivante: avec le déterminant de la matrice de covariance de X et Y, le déterminant de la matrice de covariance de X et le déterminant de la matrice de covariance de Y. si et seulement si X et Y sont des variables aléatoires indépendantes. L'information mutuelle est positive ou nulle. L'information mutuelle est symétrique. Data processing theorem: si et sont deux fonctions mesurables alors . Ceci signifie qu'aucune transformation sur les données brutes ne peut faire apparaître de l'information. Lorsque la distribution jointe des variables aléatoires et suit une loi normale multidimensionnelle , il a été montré que l'information mutuelle est directement reliée au coefficient de corrélation entre ces deux variables : Plusieurs généralisations de cette quantité à un nombre plus grand de variables ont été proposées, mais aucun consensus n'a encore émergé.
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.