Généralisation des modèles d'ANOVA

Outils pédagogiques complémentaires

Introduction

Comme vu précédemment, le protocole d'une expérience peut être modélisé en une équation mathématique.

Ce chapitre nous permet de déterminer, par un test statistique de Fisher-Snedecor, si chacun des composants de variance de l'équation a une influence significative sur le paramètre étudié.

Méthodologie :

  1. après avoir modélisé sous forme d'équation le protocole expérimental, déterminer l'espérance du carré moyen correspondant à chaque composant de cette équation.
  2. calculer le Fobservé pour chaque composant.
    Rappelons que le test F est un rapport de carrés moyens. Au numérateur nous aurons le CM du composant et au dénominateur le CM du terme correspondant au carré moyen étudié.
  • Si le composant a une influence significative, il devra être pris en compte dans la modélisation.
  • Dans le cas contraire, l'équation de base pourra être simplifiée et le composant sera éliminé. Il ne faudra donc plus tenir compte de ce critère pour expliquer le paramètre étudié.

Contexte

Énoncé de l'expérience:

Pour fixer les quotas laitiers de la Région wallonne, l'expérimentateur prospecte l'Ardenne, le Condroz et la Hesbaye. Dans chaque région, il recueille les statistiques de production de 4 vaches prises au hasard, en été et en hiver. Sur chacune de ces vaches, il réalise 3 traites pour mesurer la quantité de lait.


Représentation de l'expérience:

 
été
hiver
traite 1
traite 2
traite 3
traite 1
traite 2
traite 3
Ardenne
vache 1
qtité lait
         
vache 2            
vache 3            
vache 4            
Condroz
vache 1            
vache 2            
vache 3            
vache 4            
Hesbaye
vache 1            
vache 2            
vache 3            
vache 4            

Critères:

Région: ai où i = 3
- critère fixe avec 3 niveaux
- croisé au critère Saison

Vache: B(i)j où j = 4
- critère aléatoire avec 4 niveaux
- hiérarchisé au critère Région
- croisé au critère Saison

Saison: ck où k = 2
- critère fixe à 2 niveaux
- croisé au critère Région
- croisé au critère Vache

Nombre de réplicats: l = 3

 

Équation:

x(ijk) l = mx + ai + B(i)j + ck + acik + Bc(i)jk + E(ijk)l

La production laitière pourrait donc être influencée par:

  • la Région seule: ai
  • la Vache seule: B(i)j
  • la Saison seule: ck
  • l'interaction Région / Saison: acik
  • l'interaction Vache / Saison: Bc(i)jk
  • la variabilité entre les 3 traites (variabilité résiduelle non testable)

  ne pas oublier de tenir compte des erreurs de mesures E(ijk)l (important quand la mesure est répétée).

Règle 1

Espérances des carrés moyens de chaque composant

Application de la règle 1

  • δ2 our les critères fixes
  • S2 pour les critères aléatoires

Si l'indice:

  • n'est pas epris dans le membre en tête de ligne, mettre la valeur de l'indice en question
  • est repris dans le membre en tête de ligne, se rapporte à un critère fixe (minuscule) et n'est pas entre parenthèses, mettre la valeur 0
  • est repris dans le membre en tête de ligne, ne répond pas aux conditions précédentes, mettre la valeur 1

Exemple

   
i = 3
j = 4
k = 2
l = 3
δ2a
ai
0
4
2
3
S2B
B(i)j
1
1
2
3
δ2c
ck
3
4
0
3
δ2ac
acik
0
4
0
3
S2Bc
Bc(i)jk
1
1
0
3
S2
E(ijk)l
1
1
1
1

 

Règle 2

Espérances des carrés moyens de chaque composant:

Application de la règle 2

Considérer uniquement les sources de variabilité qui ont au moins tous les indices repris en tête de ligne.

Exemple

pour acik, pour prendre les δ2 et S2, il faut que les deux indices i et k soient présents

 
i = 3
j = 4
k = 2
l = 3
 
δ2a
ai
0
4
2
3
δ2a
S2B
 
δ2ac
S2Bc
S2
S2B
B(i)j
1
1
2
3
 
S2B
   
S2Bc
S2
δ2c
ck
3
4
0
3
   
δ2c
δ2ac
S2Bc
S2
δ2ac
acik
0
4
0
3
     
δ2ac
S2Bc
S2
S2Bc
Bc(i)jk
1
1
0
3
       
S2Bc
S2
S2
E(ijk)l
1
1
1
1
         
S2

Règle 3

Espérances des carrés moyens de chaque composant

Application de la règle 3

  1. Masquer les colonnes correspondant aux indices qui ne sont pas entre parenthèses.
  2. Pondérer chaque terme par le produit des indices non masqués.

 Exemple

 
i = 3
j = 4
k = 2
l = 3
 
δ2a
ai
0
4
2
3
24δ2a
6S2B
 
2ac
0S2Bc
1S2
S2B
B(i)j
1
1
2
3
 
6S2B
   
0S2Bc
1S2
δ2c
ck
3
4
0
3
   
36δ2c
2ac
3S2Bc
1S2
δ2ac
acik
0
4
0
3
     
12δ2ac
3S2Bc
1S2
S2Bc
Bc(i)jk
1
1
0
3
       
3S2Bc
1S2
S2
E(ijk)l
1
1
1
1
         
1S2

Conclusion

Détermination des tests d'hypothèses et conclusions

Rappelons que l'intérêt de cette démarche est de déterminer quels composants de l'équation initiale sont pertinents pour expliquer la production laitière.

Chaque composant devra donc faire l'objet d'un test d'hypothèses et donc il faut, pour chacun de ces composants, calculer un F observé.

x(ijk)l = mx + ai + B(i)j + ck + acik + Bc(i)jk + E(ijk)l

Application de la règle 4 pour déterminer les degrés de liberté de chaque test d'hypothèses

Effectuer le produit de la valeur maximale de tous les indices représentés en tête de ligne, après avoir retiré 1 à ceux qui ne sont pas entre parenthèses.

Exemple

 
i=3
j=4
k=2
l=3
 
dl
δ2a
ai
0
4
2
3
24δ2a
6S2B
 
2ac
0S2Bc
1S2
2
S2B
B(i)j
1
1
2
3
 
6S2B
   
0S2Bc
1S2
9
δ2c
ck
3
4
0
3
   
36δ2c
2ac
3S2Bc
1S2
1
δ2ac
acik
0
4
0
3
     
12δ2ac
3S2Bc
1S2
2
S2Bc
Bc(i)jk
1
1
0
3
       
3S2Bc
1S2
9
 
S2
E(ijk)l
1
1
1
1
         
1S2
48

Test 1:

H0: δ2a = 0
H1 : δ2a ≠ 0

si δ2a = 0, l'espérance du CMa devrait être égale au CMB = 6S2B + 1S2. Le rapport entre le CMa et le CMB devrait être proche de 1.

Donc, TeX Embedding failed!

  1. si le test est significatif, alors δ2a ≠ 0
    alors, il faut maintenir ai dans l'équation finale puisque la région influence la production laitière de manière significative
  2. si le test est non significatif, alors δ2a = 0
    alors, nous pouvons supprimer ai de l'équation finale puisque la région n'influence pas la production laitière

Test 2:

H0: S2B = 0
H1 : S2B ≠ 0

    si S2B = 0, L'espérance du CMB devrait être égale au CMR = 1S2. Le rapport entre le CMB et le CMR devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors S2B ≠ 0
      alors, il faut maintenir B(i)j dans l'équation finale puisque le critère vache influence la production laitière de manière significative
    2. si le test est non significatif, alors S2B = 0
      alors, nous pouvons supprimer B(i)j de l'équation finale puisque le critère vache n'influence pas la production laitière

Test 3:

H0: δ2c = 0
H1 : δ2c ≠ 0

    si δ2c = 0,  l'espérance du CMc devrait être égale au CMBc =3S2Bc + 1S2. Le rapport entre le CMc et le CMBc devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors δ2c ≠ 0
      alors, il faut maintenir ck dans l'équation finale puisque la saison influence la production laitière de manière significative
    2. si le test est non significatif, alors δ2c = 0
      alors, nous pouvons supprimer ck de l'équation finale puisque la saison n'influence pas la production laitière

Test 4:

H0: δ2ac = 0
H1 : δ2ac ≠ 0

    si δ2ac = 0, l'espérance du CMac devrait être égale au CMBc =3S2Bc + 1S2. Le rapport entre le CMac et le CMBc devrait être proche de 1.
    donc, TeX Embedding failed!

    si le test est significatif, alors δ2ac ≠ 0
    alors, il faut maintenir acik dans l'équation finale puisque l'interaction région/saison influence la production laitière de manière significative

    si le test est non significatif, alors δ2ac = 0
    alors, nous pouvons supprimer acik de l'équation finale puisque l'interaction région/saison n'influence pas la production laitière


Test 5:

H0: S2Bc = 0
H1 : S2Bc ≠ 0

    si S2Bc = 0, l'espérance du CMBc devrait être égale au CMR = 1S2. Le rapport entre le CMBc et le CMR devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors S2Bc ≠ 0
      alors, il faut maintenir Bc(i)jk dans l'équation finale puisque l'interaction vache/saison influence la production laitière de manière significative
    2. si le test est non significatif, alors S2Bc = 0
      alors, nous pouvons supprimer Bc(i)jk de l'équation finale puisque l'interaction vache/saison n'influence pas la production laitière