La distribution F de Fisher-Snedecor est souvent utilisée pour comparer deux variances. On peut montrer que le rapport de deux variances suit une loi de Fisher caractérisée par deux nombres de degrés de liberté (k et r) correspondant au nombre de degrés de liberté du numérateur et au nombre de degrés de liberté du dénominateur. La variable F ne peut prendre que des valeurs positives et sa distribution est fortement asymétrique.
Exemple: Test de comparaison de 2 variances
Ce test a pour objectif de vérifier si les variances de deux populations sont différentes ou non à partir des variances S²1 et S²2, calculées à partir des échantillons de tailles respectives n1 et n2, prélévés dans les 2 populations.
H0: σ²1 = σ²2
H1: σ²1 différent de σ²2
Supposons que S²1 soit plus grande que S²2
La statistique à utiliser pour éprouver H0 est: TeX Embedding failed!
Il s'agit d'une variable aléatoire F de Fisher-Snedecor à k et r degrés de liberté où: k = (n1-1) degrés de liberté Pour faciliter la lecture des tables la variance la plus grande se placera au numérateur et le seuil de confiance (1-α) sera (1-TeX Embedding failed!) La conclusion du test est: si Fobs est plus grand que le F théorique (avec k et r degrés de liberté et la probabilité 1-TeX Embedding failed!), alors il y aura rejet de l'hypothèse nulle (H0): le rapport entre les 2 variances observées est trop grand pour être attribué au hasard de l'échantillonnage.
r = (n2-1) degrés de liberté
Choisir la page de F en fonction de p=... (0,95; 0,975; 0,99; etc.)
k
r
1
2
3
4
5
...
...
...
1
2
P(Fk;r<Fk;r;p)=p
3
...
...
...
...
La variable aléatoire F de Fisher est souvent utilisée pour comparer les variances de deux échantillons de tailles différentes. L'homogénéité des variances des populations (homoscedasticité) est une condition prélable à la comparaison des moyennes des populations. Si les variances sont hétérogènes, on ne peut comparer les moyennes. Une solution parfois possible est de transformer les données (par exemple X'= log(x)), ce qui pourrait rendre les variances plus homogènes.
Dans le cas où l'expérience contient plus de deux échantillons, on emploiera le test de Hartley, pour autant que les échantillons soient de même taille.
Le rapport de deux variances (carrés moyens) calculé dans une analyse de variance (ANOVA) se teste également par une variable de Fisher. Par exemple:
TeX Embedding failed! |
Qui est aussi une valeur F de Fisher-Snedecor pour k et r degrés de liberté tels que:
Comme précédemment, si le Fobs est supérieur au F théorique, il y a RH0.