Le facteur d'inflation de la variance , appelé
inflation de R2 par Modalisa, permet de détecter
l'existence de collinéarité entre régresseurs.
En règle générale, si le facteur d'inflation de la
variance (noté fi) d'un régresseur est supérieur
à 10, on dira que cela traduit l'existence de
collinéarité de ce régresseur avec d'autres. Le
seul examen de la matrice de corrélation est alors
insuffisant car il ne permet pas de déceler
l'existence de collinéarité.
Parallèlement, il est possible de bâtir un indice
global d'inflation mesurant la dépendance entre les
régresseurs, cet indice est lié à la
collinéarité entre régresseurs, il est couramment
nommé indice de multicollinéarité , on le calcule
comme suit:
- F = (1/n)*Sfi
n
étant le nombre de variables explicatives du
modèle considéré
Des valeurs trop importantes de cet indice doivent
attirer l'attention comme dans cet exemple où
F=15,80.
L'analyse de ce facteur d'inflation permet de
soulever un problème important, à savoir que
l'existence d'une collinéarité trop importante
entre plusieurs variables explicatives peut
entraîner certaines imprécisions dans les
estimations.
Il paraît alors intéressant d'étudier le tableau
de la " Proportion de la variance des
coefficients de régression " qui permet de
savoir, d' une part, quelles variables explicatives
sont collinéaires, et d'autre part quelles sont les
causes d'une importante inflation.
Notons que s'il n'existait aucune collinéarité
entre les régresseurs alors chaque fi prendrait une
valeur égale à 1.
|