Analyse de la variance (b)

 

Analyse de la variance (ANOVA : ANalysis Of VAriance)

On analyse la variance lorsqu’on souhaite identifier la présence ou non d’un lien entre une variable qualitative et une variable quantitative.

Ex : y a-t-il un lien entre la marque d’une voiture (variable qualitative) et le nombre de PV récoltés pour excès de vitesse (variable quantitative) ?

Ex2 : y a –t-il un lien entre le genre (masculin/féminin) et le nombre d’activités sportives pratiquées à l’adolescence[ 1] ?

Tout d’abord, qu’est-ce-que la variance ?

Concrètement, la variance est un indicateur de dispersion d'une variable numérique, égal à la moyenne des carrés des écarts à la moyenne.

Un indicateur de dispersion permet d’observer la manière dont les valeurs d’un protocole sont distribuées. Cette répartition des valeurs va donner des indications sur l’effet d’une variable, ou d’une de ses modalités, sur ce que l’on mesure (la variable dépendante).

Le principe de l’ANOVA

L’analyse de la variance consiste en un test où l’on conclut à l’acceptation ou au rejet de  l’hypothèse nulle (appelée Ho). Cette hypothèse nulle propose qu’il n’y ait aucun lien entre la variable quantitative et la variable qualitative étudiées.

« Nous savons que la variance est une mesure de la variabilité : elle permet d’estimer l’hétérogénéité ou, au contraire, l’homogénéité d’une série de valeurs. » [2]

Pour vérifier s’il y a lien entre la variable qualitative et la variable quantitative, il nous faut observer la variabilité des résultats au sein des groupes et entre les groupes.

S’il y existe un lien entre les deux variables, la variabilité entre les deux groupes doit être importante, alors qu’elle tendra à être nulle à l’intérieur-même des groupes.

Ex : Si le genre est lié au nombre d’activités sportives pratiquées, ce nombre devrait être quasi identique parmi les sujets féminins et quasiment identique chez tous les sujets masculins, mais hétérogène entre le groupe des filles et le groupe des garçons.

S’il n’existe aucun lien entre les deux variables, les résultats intra-groupe peuvent être très hétérogènes alors que la variabilité inter-groupe sera quasiment nulle.

Ex : Si le genre n’est pas lié au nombre d’activités sportives pratiquées, les comportements des garçons diffèrent peu ou prou de ceux des filles. En revanche, les filles entre elles pourront avoir des pratiques sportives très différentes les unes des autres ainsi que les garçons entre eux.

« Cet exemple suggère que pour se faire une idée de l’existence d’un lien éventuel entre la pratique sportive et le sexe des adolescents, il suffit de comparer les variabilités au sein des groupes et la variabilité entre les groupes. Le principe général de l’ANOVA réside dans cette comparaison des variabilités. » [3]


 

[1] Enquête du CERLIS, Centre de Recherche sur les Liens Sociaux, et de l’enseignement de méthodologie de la Faculté des Sciences Humaines et Sociales de l’Université Paris-Descartes, 2002, in Olivier Martin, L’Analyse de données quantitatives, Armand Colin, collection sociologie, Paris, 2005, p.93

 [2] Citation d’Olivier Martin, L’Analyse de données quantitatives, Armand Colin, collection sociologie, Paris, 2005, p.94

 [3] Citation d’Olivier Martin, L’Analyse de données quantitatives, Armand Colin, collection sociologie, Paris, 2005, p.94