La régression de Cox (modèle à risque proportionnel) est une classe de modèles de survie en statistique. Les modèles de survie étudient le temps écoulé avant qu'un événement ne survienne. Historiquement, dans le modèle de Cox, cet événement est le décès de l'individu, c'est pourquoi on parle généralement de survie et de décès. Au cours des années, l'utilisation du modèle s'est étendue à d'autres situations, l'événement peut donc être de quelconque nature : il peut s'agir de la récidive d'une maladie, ou à l'inverse d'une guérison. D'un point de vue statistique, la nature de l'événement n'est bien sûr pas importante, il s'agira alors d'interpréter les coefficients en conséquence.
Prenons le cas d'une étude longitudinale, bien souvent, il n'est pas envisageable de suivre les individus sur une longue période, et les événements ne sont pas forcément observés sur toute la population, on parle alors de données tronquées ou censurées. L'avantage d'un modèle comme celui de Cox est que l'on peut prendre en compte ces données même si elles ne sont pas « complètes ».
Le modèle de Cox exprime la fonction de risque instantané de décès (on peut aussi trouver les appellations suivantes : fonction de risque, taux de panne, taux de fiabilité, force de mortalité, taux de risque...) en fonction du temps et des covariables . On a alors :
De manière plus formelle, pour un individu, la fonction correspond au risque instantané de décès à l'instant t sachant qu'il est vivant juste avant t.
est appelé le risque de base. Il correspond au risque instantané de décès lorsque toutes les covariables sont nulles.
On peut noter quelques points :
On peut séparer la formule en deux parties, la première () est dépendante du temps contrairement à la seconde () qui elle ne dépend que des covariables (le modèle de Cox peut aussi s'étendre à des covariables qui dépendent du temps, confère à sous-partie correspondante).
On dit que le modèle de Cox est semi-paramétrique. En effet, on ne cherche pas à estimer la fonction , qui en fait, est la même pour tous les individus à un instant donné.