|
Il existe 4 distributions différentes auxquelles on se
réfère dans un raisonnement inférentiel en statistiques :
- La
distribution d’une variable dans la population parente
- La
distribution de cette variable dans un échantillon aléatoire
- La
distribution d’échantillonnage en statistiques
- La
distribution standard de référence.
Les échantillons d’observations sont souvent les seules données dont le
chercheur dispose. Chaque caractéristique précitée de la population parente
de l’université X fournit des échantillons aléatoires de mesures dont on
peut établir la distribution.
(…) Les unités statistiques ayant fourni les observations à distribuer sont
tous les éléments de l’échantillon (ici, les N étudiants dont les
observations ont été tirées au hasard de la population parente).
Cette distribution d’échantillonnage d’une statistique est moins étalée que
ne le sont les distribution parente et échantillonnale de la variable
considérée. En effet, une statistique étant une valeur résumée, moyenne,
elle est moins extrême que ne le sont les éléments qui la composent (les
observations de l’échantillon) : la note moyenne d’un examen, par exemple,
se situe entre la note la plus faible et la note la plus forte ; c’est une
valeur plus « centrale ». D’autre part, plus le nombre d’observations
contenues dans l’échantillon prélevé d’un grand, plus la statistique a de
chance d’être proche du paramètre parent. Dès lors, la dispersion d’une
distribution d’échantillonnage d’une statistique est beaucoup plus faible
que celle de la variable parente qu’elle résume, et elle est d’autant plus
faible que l’échantillon prélevé est grand.
BEAUFILS, Béatrice (2001). Statistiques appliquées à la psychologie, Tome
2 : statistiques descriptives. Paris, Bréal, p. 42.» |