Distribution échantillonnale (b)

 

Il existe 4 distributions différentes auxquelles on se réfère dans un raisonnement inférentiel en statistiques :
-         La distribution d’une variable dans la population parente
-         La distribution de cette variable dans un échantillon aléatoire
-         La distribution d’échantillonnage en statistiques
-         La distribution standard de référence.

Les échantillons d’observations sont souvent les seules données dont le chercheur dispose. Chaque caractéristique précitée de la population parente de l’université X fournit des échantillons aléatoires de mesures dont on peut établir la distribution.

(…) Les unités statistiques ayant fourni les observations  à distribuer sont tous les éléments de l’échantillon (ici, les N étudiants dont les observations ont été tirées au hasard de la population parente).

Cette distribution d’échantillonnage d’une statistique est moins étalée que ne le sont les distribution parente et échantillonnale de la variable considérée. En effet, une statistique étant une valeur résumée, moyenne, elle est moins extrême que ne le sont les éléments qui la composent (les observations de l’échantillon) : la note moyenne d’un examen, par exemple, se situe entre la note la plus faible et la note la plus forte ; c’est une valeur plus « centrale ». D’autre part, plus le nombre d’observations contenues dans l’échantillon prélevé d’un grand, plus la statistique a de chance d’être proche du paramètre parent. Dès lors, la dispersion d’une distribution d’échantillonnage d’une statistique est beaucoup plus faible que celle de la variable parente qu’elle résume, et elle est d’autant plus faible que l’échantillon prélevé est grand.

BEAUFILS, Béatrice (2001). Statistiques appliquées à la psychologie, Tome 2 : statistiques descriptives. Paris, Bréal, p. 42.»