Tout expérimentateur est amené à se poser la question suivante:
La valeur obtenue dans un échantillon est-elle conforme à un modèle établi? Ou encore, cette valeur est-elle probable, étant donné un modèle supposé.
Par exemple, si la moyenne réelle de la pression sanguine de la population était de 120 mm Hg, est-il normal (probable) d'obtenir une moyenne d'échantillon de 140 mm Hg?
En disant cela on introduit la notion de test d'hypothèses.
L'expérimentateur est amené à établir, suivant un seuil de confiance arbitraire, une limite (ou 2 limites) afin de séparer ce qu'il considère comme des valeurs conformes "probables" (la zone de confiance) et des valeurs non conformes "peu probables" (la zone d'erreur de type I). Cette limite s'appelle le seuil de signification. En termes de variable normale réduite et de test unidirectionnel, le seuil de signification a pour valeur, Z1-alpha, c'est-à-dire la valeur de la table de Z qui correspond à une probabilité de 1-alpha (test de conformité d'une moyenne à un standard avec variance connue).
Pour répondre à cette question, l'expérimentateur va devoir définir arbitrairement une limite (une frontière) entre la conformité (en vert) ou événements probables et la non conformité à un modèle (en rouge) ou événements peu probables.
L'expérimentateur peut ainsi définir 3 types de limites selon l'hypothèse à tester:
Seuil: Z1-α
Confiance: 1-α
L'expérimentateur désire tester si la statistique de l'échantillon est significativement supérieure à celle attendue : "L'individu mesuré ou la moyenne de l'échantillon sont-ils conformes (probables) ou significativement plus grands (peu probables) que prévus par le modèle?"
Seuil: Zα
Confiance: 1-α
L'expérimentateur désire tester si la statistique de l'échantillon est significativement inférieure à celle attendue: "L'individu mesuré ou la moyenne de l'échantillon sont-ils conformes (probables) ou significativement plus petits (peu probables) que prévus par le modèle?"
Seuils: TeX Embedding failed! et TeX Embedding failed!
Confiance: 1-α
L'expérimentateur désire tester si la statistique de l'échantillon est significativement différente de celle attendue, soit trop petite soit trop grande: "L'individu mesuré ou la moyenne de l'échantillon sont-ils conformes ou non (soit plus grands ou plus petits) au modèle?"
En rouge :
Elle constitue une zone de faible probabilité fixée par l'expérimentateur. En général, elle équivaut à 5%, 1% voire 0,1% de la surface totale sous la courbe de Gauss.
Pour qu'une mesure ou une moyenne se retrouve dans cette zone, il faut que sa valeur soit très éloignée du centre de la distribution µ (ou 0 si on travaille avec une variable normale réduite) au point de dépasser la valeur seuil xa.
Si tel est le cas, on suppose qu'il y a beaucoup de chances que cette mesure (ou cette moyenne) n'ait pas été obtenue par hasard (comme il y a moins de alpha chances d'obtenir une telle valeur). On en déduit que la mesure (ou la moyenne) provient d'une autre population (population 1) que celle prévue par le modèle H0, où la valeur observée est beaucoup plus probable. En décidant que le modèle H0 est invalide il y a cependant alpha % de chances de se tromper. Comme cet alpha est fixé par l'expérimenteur, le risque encouru ou erreur de type I est connu et peut être très petit.
En vert :
Une valeur comprise dans cette zone de confiance est considérée par l'expérimentateur comme une valeur tout à fait conforme au modèle H0 décrivant la population d'origine centrée sur la moyenne µ. La valeur est considérée comme probable et la différence observée par rapport à la moyenne µ du modèle H0 peut être atttribuée au hasard résultant de l'échantillonnage aléatoire.
Cette zone représente 95%, 99% voire 99,9% de la surface de la courbe de Gauss. La distance qui sépare la valeur observée de la moyenne µ du modèle H0 n'est pas suffisante pour être considérée comme non conforme ou "improbable" (car inférieure à la distance séparant µ du seuil de signification).
Dans cette zone, l'expérimentateur doit admettre que la valeur observée est conforme à la population centrée sur µ. Ce n'est pas pour autant que le modèle H0 est validé mais il n'a pas réussi à démontrer le contraire, c'est-à-dire que l'échantillon proviendrait d'une autre population centrée sur une autre moyenne.
Un expérimentateur a mesuré un chevaine de 3 ans et veut le comparer à la population de chevaines de 3 ans centrée sur µ. Son point de départ est de dire que l'individu est conforme à cette population: c'est l'hypothèse nulle H0. Ce qu'il veut démontrer est SOIT:
Le choix de l'hypothèse alternative H1 se fait en fonction des connaissances a-priori ou scientifiques de l'expérimentateur (par exemple, conditions d'élevage favorables ou défavorables) et NON en fonction de la valeur observée qui peut être inférieure ou supérieure à la valeur attendue simplement par le jeu de l'échantillonnage aléatoire.
L'expérimentateur a obtenu une taille pour le poisson capturé (ou une taille moyenne s'il en a capturé plusieurs). Pour faciliter sa prise de décision (Accepter le fait que ce poisson est normal [acceptation de H0 = AH0] ou non [rejet de H0 = RH0]), il va réduire la valeur observée en une valeur réduite (z réduit, t réduit, ...).
En fonction du alpha déterminé par l'expérimentateur et de l'hypothèse H1 choisie, il va définir un seuil de signification particulier.
Soit une différence à mettre en évidence pour un alpha de 5% (test bidirectionnel: il y a donc 2 seuils à trouver Z0,025 et z0,975) .
Dans la table, on localise la valeur la plus proche de 0,975 afin de trouver z0,975. Le z trouvé dans les tables est de 1,96. Par symétrie, on peut déduire le z0,025: -1,96
En comparant la valeur réduite des observations (z observé) avec la valeur seuil trouvée dans les tables, l'expérimentateur peut tirer une conclusion à son test.
Soit une valeur de z observée de -1,84 pour un test bidirectionnel avec un alpha de 5%. Dans ce cas, -1,84 est compris entre -1,96 et 1,96. La valeur étant comprise entre les deux valeurs seuils, elle est considérée comme "normale". Cela revient à dire que la probabilité d'obtenir une valeur (1,84) aussi éloignée de 0 est plus grande que 5%. On considère donc que l'événement est probable sous H0 et que la valeur observée est due au hasard de l'échantillonnage.
La conclusion au test est la suivante: La différence entre la mesure observée et la valeur attendue peut être attribuée au hasard de l'échantillonnage. Par conséquent, on accepte l'hypothèse nulle (AH0).
Si la valeur observée n'était pas comprise entre -1,96 et 1,96, l'expérimentateur aurait pu conclure que la mesure observée était trop différente de la normale ou trop peu probable sous H0 (< 5%). Par conséquent, il aurait rejeté l'hypothèse nulle (RH0).
Dans le cas d'un test bidirectionnel, RH0 signifie bien sûr la mise en évidence d'une différence de la valeur observée par rapport à la normale MAIS on peut aller plus loin. En effet, pour un même alpha MAIS pour un test unidirectionnel, on aura aussi un RH0. L'expérimentateur pourra donc dire qu'il y a une différence de la mesure mais aussi que celle-ci est plus grande ou plus petite que la normale.
Attention: La conclusion inverse n'est pas vraie. Ce n'est pas parce qu'on rejette l'hypothèse nulle (RH0) dans un test unidirectionnel avec un alpha déterminé qu'il y a rejet de l'hypothèse nulle (RH0) pour un test bidirectionnel avec le même alpha.
1. Un écologiste étudie une population de chauves-souris de l'espèce Grand Rhinolophe. D'après la littérature, il sait que l'envergure de ces chiroptères obéit à une distribution normale dont la moyenne est de 375 mm pour une variance de 225 mm2.
Cet écologiste capture un individu dont la taille est de 350 mm. Cet individu est-il considéré comme conforme ou bien est-il significativement différent de ce que prévoit le modèle?
2. Un biologiste étudie l’envergure du Grand Rhinolophe. Dans la littérature, il trouve que l’envergure moyenne théorique µ est de 375 mm et la variance de 225 mm2.
µ | σ | Xobservé | Zobservé | Z0,95 | Z0,99 | Conclusion | |
Poids | 26 | 4,5 | 35 | ||||
Longueur oreille | 23 | 1,5 | 25,2 | ||||
Longueur avant-bras | 57,5 | 1,75 | 58 | ||||
Longueur tête-corps | 64 | 3,5 | 72 | ||||
Envergure | 375 | 12,5 | 404,1 |