La fonction logit est une fonction mathématique utilisée principalement
en statistiques et pour la régression logistique,
en intelligence artificielle (réseaux neuronaux),
en inférence bayésienne pour transformer les probabilités sur [0,1] en évidence sur R afin d'une part d'éviter des renormalisations permanentes, et d'autre part de rendre additive la formule de Bayes pour faciliter les calculs.
Son expression est
où p est défini sur ]0, 1[
La base du logarithme utilisé est sans importance, tant que celle-ci est supérieure à 1. Le logarithme népérien (base e) est souvent choisi, mais on peut lui préférer le logarithme décimal (base 10) pour mettre en évidence les ordres de grandeur décimaux : logit(p) = –4 correspond alors à une probabilité de 10, etc. En fiabilité, Myron Tribus utilise une base 10, soit dix fois le logarithme décimal, et les nomme des décibels par analogie avec les niveaux de bruit. Pour éviter toute confusion, Stanislas Dehaene appelle cette unité déciban dans ses cours au Collège de France, du nom inventé par Alan Turing en 1940, repris par d'autres auteurs.
Utilisée avec le logarithme népérien, la fonction logit est la réciproque de la sigmoïde :
Elle est donc utilisée pour linéariser les fonctions logistiques.
La fonction logit étant définie sur ]0,1[, on s'intéresse aux deux points extrêmes et au point central.
La fonction logit est dérivable pour tout . Avec le logarithme népérien, sa valeur est
Étant donné que, pour tout , et , la fonction logit est strictement croissante.
En utilisant les propriétés du logarithme népérien et la forme de ses primitives, on montre que sa primitive qui s'annule en 0 s'écrit :
Si p est une probabilité, cette probabilité sera toujours comprise entre 0 et 1, et donc toute tentative pour ajuster un nuage de probabilité par une droite sera invalidée par le fait que la droite n'est pas bornée. La transformation de p en p/(1–p) permet de travailler sur des valeurs variant de 0 à +∞, puis le passage au logarithme permet de travailler sur un nuage de points dont les valeurs varient entre –∞ et +∞, ce qui rend possible l'approximation par une droite réelle.