La variable alétoire t de Student est une variable aléatoire continue dont la fonction de densité de probabilités est symétrique et dépend d'un paramètre k ou nombre de degrés de liberté. Elle est obtenue par réduction d'une variable aléatoire normale (comme la variable Z abordée au module 70) mais la variance de la population σ2 est remplacée par la variance S2 de l'échantillon. Le nombre de degrés de liberté k est en général, égal à la taille de l'échantillon n -1.
Comme la variable réduite Z (voir module 70), la variable t de Student a pour moyenne 0, mais sa variance n'est plus 1, elle est toujours > 1, mais d'autant plus proche de 1 que son nombre de degrés de liberté est grand. Lorsque n = ∞, t v.a. N(0;1). Donc, lorsque n = ∞ -> t=z.
La réduction de Student est communément employée pour convertir une moyenne expérimentale en une valeur réduite selon l'application du Théorème central limite (voir ces quelques pages...).
La réduction d'une variable observée, ici la moyenne d'un échantillon, en une variable t s'effectue comme suit:
Au lieu de :
TeX Embedding failed!
on remplace σ2 par S2 et on obtient
TeX Embedding failed!
avec m la moyenne de l'échantillon, µ la moyenne de la population, S2 la variance de l'échantillon, et S l'écart-type de l'échantillon.
Cette valeur de t observée tient compte de la taille de l'échantillon, car plus n est grand, plus S estime correctement σ. La précision de cette estimation est prise en compte dans le modèle mathématique de la distribution de Student à travers le nombre de degrés de liberté (k=n-1), qui augmente d'autant plus que n augmente.
Exemple :
Cherchons dans les tables la valeur réduite en dessous de laquelle on trouve 95% des individus :
Dans le cas de z v.a. N(0;1) si P(Z<z)=0,95 -> z=1,645
Dans le cas d'une distribution de Student avec k=40 degrés de liberté : t40;0,95 = 1,684
Dans le cas d'une distribution de Student avec k=20 degrés de liberté : t20;0,95 = 1,725
Dans le cas d'une distribution de Student avec k=10 degrés de liberté : t10;0,95 = 1,812
Dans le cas d'une distribution de Student avec k=5 degrés de liberté : t5;0,95 = 2,015
...
Exercices
1. Soit une population de chauves-souris dont on connait la longueur moyenne des oreilles (µ=23 mm). On prélève un échantillon de 21 chauves-souris dont la longueur moyenne des oreilles est de 22,34 mm avec une variance de 49 mm2. La moyenne de cet échantillon se situe-t-elle dans les 95% des moyennes les plus plausibles autour de la moyenne de la population ?
2. Soit une population de chauves-souris dont on connait la longueur moyenne des oreilles (µ=23 mm). On prélève un échantillon de 21 chauves-souris dont la longueur moyenne des oreilles est de 20,5 mm avec une variance de 16 mm2. La moyenne de cet échantillon se situe-t-elle dans les 95% des moyennes les plus plausibles autour de la moyenne de la population ?
3. Pour une population de vipères à collier adultes, on enregistre une longueur moyenne de corps de 130 cm. Sachant qu'on prélève un échantillon de 9 individus dont la longueur moyenne est de 133,33 cm avec une variance de 81 cm2.
La moyenne de cet échantillon se situe-t-elle dans les 95% des moyennes les plus plausibles autour de la moyenne de la population ?
Qu'en est-il avec un autre échantillon de 9 individus dont la moyenne vaut 139 cm et de même variance que le précédent ?