R2 inflation de sur régression multiple

Le facteur d'inflation de la variance , appelé inflation de R2 par Modalisa, permet de détecter l'existence de collinéarité entre régresseurs.
En règle générale, si le facteur d'inflation de la variance (noté fi) d'un régresseur est supérieur à 10, on dira que cela traduit l'existence de collinéarité de ce régresseur avec d'autres. Le seul examen de la matrice de corrélation est alors insuffisant car il ne permet pas de déceler l'existence de collinéarité.

Parallèlement, il est possible de bâtir un indice global d'inflation mesurant la dépendance entre les régresseurs, cet indice est lié à la collinéarité entre régresseurs, il est couramment nommé indice de multicollinéarité , on le calcule comme suit:
F = (1/n)*Sfi              n étant le nombre de variables explicatives du modèle considéré


Des valeurs trop importantes de cet indice doivent attirer l'attention comme dans cet exemple où F=15,80.

L'analyse de ce facteur d'inflation permet de soulever un problème important, à savoir que l'existence d'une collinéarité trop importante entre plusieurs variables explicatives peut entraîner certaines imprécisions dans les estimations.

Il paraît alors intéressant d'étudier le tableau de la " Proportion de la variance des coefficients de régression " qui permet de savoir, d' une part, quelles variables explicatives sont collinéaires, et d'autre part quelles sont les causes d'une importante inflation.
Notons que s'il n'existait aucune collinéarité entre les régresseurs alors chaque fi prendrait une valeur égale à 1.

 


 Copie d'écran Modalisa 2- 4 voir améliorations sur versions plus récentes - Editeur Kynos sarl