Ce test s'applique lorsqu'on souhaite démontrer l'indépendance ou la dépendance de deux critères dans une expérience portant sur une v.a. discrète.
Soient plusieurs échantillons pouvant être classés selon un certain nombre de colonnes (critère 1) et de lignes (critère 2).
Supposons la situation suivante: Au cours d'une enquête, on interroge 1 369 mères d'enfants nés avec au moins une malformation et 2 968 mères d'enfants nés sans malformation.
On constate que 35,06% des mères d'enfants nés avec au moins une malformation et 33,02% des mères d'enfants nés sans malformation fumaient.
Effectuez l'analyse statistique complète de ces résultats.
Hypothèse initiale (hypothèse nulle H0): le fait d'avoir au moins une malformation à la naissance ne dépend pas du fait que la mère soit fumeuse ou non. Les deux critères sont indépendants.
Hypothèse alternative (H1): Les 2 critères "avoir un enfant avec au moins une malformation ou non " et "être issu une mère fumeuse ou non" sont dépendants (liés)
Remarque: Dans cet exemple, "être un enfant avec au moins une malformation ou normal" constitue 2 états du critère 1 et "être issu d'une mère non fumeuse ou fumeuse" constitue 2 états du critère 2. Il faut cependant noter que le nombre d'états de chaque critère n'est pas restreint à 2.
Grâce aux données fournies par l'énoncé, il est possible de réaliser le tableau suivant:
valeurs observées |
enfant avec au moins une malformation
|
enfant sans malformation
|
Total |
---|---|---|---|
mère fumeuse
|
480 | 980 | 1460 |
mère non fumeuse
|
889 | 1988 | 2877 |
Total | 1369 | 2968 | 4337 |
Dans ce tableau, on retrouve les fréquences expérimentales mais aussi les totaux par lignes (1460 enfants sont nés de mères fumeuses contre 2877 de mères non fumeuses) et par colonnes (1369 enfants sont nés avec au moins une malformation contre 2968 enfants normaux) ainsi que le nombre total d'individus analysés dans l'expérience (4337).
En suivant le modèle H0 , il est possible d'estimer des valeurs théoriques sur base des valeurs expérimentales. La manière d'y parvenir est décrite dans le tableau suivant:
valeurs théoriques:
|
enfant avec au moins une malformation
|
enfant sans malformation
|
|
mère fumeuse
|
TeX Embedding failed!
|
TeX Embedding failed!
|
1460
|
mère non fumeuse
|
TeX Embedding failed!
|
TeX Embedding failed!
|
2877
|
1369
|
2968
|
4337
|
Pour mesurer, sur l'ensemble des catégories, la différence entre les fréquences observées et théoriques, on réduit les écarts suivant la méthode du Χ2:
TeX Embedding failed! |
On obtient alors le tableau suivant:
enfant avec au moins une malformation
|
enfant sans malformation
|
||
mère fumeuse
|
TeX Embedding failed!
|
TeX Embedding failed!
|
|
mère non fumeuse
|
TeX Embedding failed!
|
TeX Embedding failed!
|
|
ou encore:
enfant avec au moins une malformation
|
enfant sans malformation
|
|
mère fumeuse
|
0,783
|
0,361
|
mère non fumeuse
|
0,397
|
0,183
|
Pour tirer une conclusion sur la dépendance (H1) ou l'indépendance (H0), on somme tous les Χ2 observés:
Χ2= 0,783 + 0,361 + 0,397 + 0,183 = 1,72
Et on compare ensuite cette valeur globale à une valeur des tables
Cette table est une table à double entrée:
Dans l'exemple, il n'y a que 2 lignes pour deux colonnes, soit (2-1)*(2-1) degrés de liberté. Supposons que l'on prenne un intervalle de confiance à 95% (alpha 5%), la valeur de chi-carré des tables est:
Χ2 1dl;0,95= 3,84
Le test est unilatéral à droite puisque le calcul du chi-carré observé génère uniquement des valeurs positives.
Si le chi-carré observé est plus grand que le chi-carré théorique au seuil alpha, alors on rejette l'hypothèse nulle (RH0).
Dans ce cas, on a un Χ2observé de 1,72. Cette valeur est inférieure à 3,84 (la valeur des tables). On accepte H0. Cela implique que les mères fumeuses n'ont pas plus ou moins de chance de donner naissance à un enfant avec au moins une malformation qu'une mère non fumeuse. Les deux critères sont indépendants, je n'ai pas réussi à le montrer.