|
Analyse de la variance (ANOVA :
ANalysis Of VAriance)
On analyse la variance lorsqu’on souhaite identifier la présence ou non d’un
lien entre une variable qualitative et une variable quantitative.
Ex : y a-t-il un lien entre la marque d’une voiture (variable
qualitative) et le nombre de PV récoltés pour excès de vitesse (variable
quantitative) ?
Ex2 : y a –t-il un lien entre le genre (masculin/féminin) et le nombre
d’activités sportives pratiquées à l’adolescence ?
Tout d’abord, qu’est-ce-que la variance ?
Concrètement, la variance
est un indicateur de dispersion d'une variable numérique, égal à la moyenne
des carrés des écarts à la moyenne.
Un indicateur de dispersion permet d’observer la manière dont les valeurs
d’un protocole sont distribuées. Cette répartition des valeurs va donner des
indications sur l’effet d’une variable, ou d’une de ses modalités, sur ce
que l’on mesure (la variable dépendante).
Le principe de l’ANOVA
L’analyse de la variance
consiste en un test où l’on conclut à l’acceptation ou au rejet de
l’hypothèse nulle (appelée Ho). Cette hypothèse nulle propose
qu’il n’y ait aucun lien entre la variable quantitative et la variable
qualitative étudiées.
« Nous savons que la variance est une mesure de la variabilité : elle permet
d’estimer l’hétérogénéité ou, au contraire, l’homogénéité d’une série de
valeurs. »
Pour vérifier s’il y a lien entre la variable qualitative et la variable
quantitative, il nous faut observer la variabilité des résultats au sein des
groupes et entre les groupes.
S’il y existe un lien entre les deux variables, la variabilité entre les
deux groupes doit être importante, alors qu’elle tendra à être nulle à
l’intérieur-même des groupes.
Ex : Si le genre est lié au nombre d’activités sportives pratiquées, ce
nombre devrait être quasi identique parmi les sujets féminins et quasiment
identique chez tous les sujets masculins, mais hétérogène entre le groupe
des filles et le groupe des garçons.
S’il n’existe aucun lien entre les deux variables, les résultats
intra-groupe peuvent être très hétérogènes alors que la variabilité
inter-groupe sera quasiment nulle.
Ex : Si le genre n’est pas lié au nombre d’activités sportives
pratiquées, les comportements des garçons diffèrent peu ou prou de ceux des
filles. En revanche, les filles entre elles pourront avoir des
pratiques sportives très différentes les unes des autres ainsi que les
garçons entre eux.
« Cet exemple suggère que pour se faire une idée de l’existence d’un lien
éventuel entre la pratique sportive et le sexe des adolescents, il suffit de
comparer les variabilités au sein des groupes et la variabilité entre les
groupes. Le principe général de l’ANOVA réside dans cette comparaison des
variabilités. »
|