Analyse de la variance à plusieurs critères

Critères de classification dans l'ANOVA

Outils pédagogiques complémentaires

Critères de classification

Il est possible de planifier une expérience en fonction de différents facteurs ou critères de classifications. Ceux-ci peuvent être étudiés

  • séparément : ANOVA à 1 critère ou
  • de façon simultanée en combinant les niveaux des facteurs entre eux: ANOVA à plusieurs critères de classification.

Si on étudie le taux de cholestérol dans le sang, le but est d'analyser les fluctuations de ce taux (notre mesure, notre variable) en fonction:

  1. du "régime alimentaire" (1 critère de classification)
  2. du "régime alimentaire" tout en gardant les mêmes "individus" d'un régime à l'autre (2 critères de classification)
  3. du "régime alimentaire", du "nombre de jours de traitement" avec un régime alimentaire, tout en gardant les mêmes "individus" d'un régime à l'autre (3 critères de classification).

ANOVA à un critère de classification (ANOVA 1):

L'expérimentateur constitue plusieurs échantillons contenant des individus pris au hasard dans une population déterminée. L'objectif de l'expérience est de mettre en évidence des différences de taux de cholestérol en fonction du "régime alimentaire". Le critère de classification étudié est unique: il s'agit du "régime alimentaire".

top


ANOVA à deux critères de classification:

L'expérimentateur constitue plusieurs échantillons à partir des 5 mêmes individus d'une population déterminée. Chaque individu passe successivement par 3 régimes alimentaires (avec une période de relâche entre les différents régimes). Pour chaque régime, une mesure de taux de cholestérol est réalisée.

L'objectif de l'expérience est de mettre en évidence des différences de taux de cholestérol en fonction du "régime alimentaire". Dans ce cas, il y a deux critères de classification: le critère "régime alimentaire" et le critère "individu" puisque les mesures sont effectuées sur les mêmes individus (1, 2, 3, 4 et 5) pour pour les 3 régimes.

top


ANOVA à trois critères de classification:

L'expérimentateur constitue plusieurs échantillons à partir des 5 mêmes individus d'une population déterminée qui vont tester les 3 mêmes régimes. Les 5 individus sont suivis pendant 3 jours dès le commencement de chaque régime et une mesure du taux de cholestérol est effectuée chaque jour.

L'objectif de l'expérience est de mettre en évidence des différences de taux de cholestérol en fonction du "régime alimentaire", de "l'individu" et de la "durée du régime déterminé". Dans ce cas, il y a trois critères de classification: le critère "régime alimentaire", le critère "individu" et le critère "jour".

top

Critères fixes et aléatoires

  1. critère fixe

Un critère est fixe quand les niveaux de ce critère sont déterminés et fixés par l'expérimentateur. Si on répètait l'expérience, les mêmes niveaux du facteur pourraient être sélectionnés.

  1. critère aléatoire

Un critère est aléatoire quand les niveaux de ce critère sont choisis de façon aléatoire parmi un ensemble beaucoup plus grand de niveaux. Si on répètait l'expérience, les niveaux des facteurs ne seraient plus les mêmes puisqu'ils sont choisis aléatoirement (très peu de chances d'avoir les mêmes niveaux).


Critères de classification FIXES:

L'expérience présentée ci-dessus consiste à étudier le taux de cholestérol en fonction d'un régime clairement identifié (régime à base de viande; à base d'aliments à haute teneur en graisses animales; à base de légumes). Le critère "régime" est fixé (connu): le critère est dit "fixe".


Critères de classification ALEATOIRES:

L'expérience présentée ci-dessus consiste à étudier le taux de cholestérol en fonction d'un régime (1, 2 ou 3) non précisé. Ce serait le cas si on on voulait comparer différentes régions présentant des habitudes alimentaires différentes et que dans un souci d'économie, on n'ait pu choisir que 3 régions (3 régimes) parmi un ensemble beaucoup plus vaste de possibilités.  Dans ce cas, le critère est dit est "aléatoire".

Critères croisés et hiérarchisés

  1. critères croisés

Un critère est croisé avec un autre critère quand les niveaux du premier critère sont les mêmes pour chaque niveau du second critère et inversement.

  1. critères hiérarchisés

Un critère est hiérarchisé à un autre critère quand les niveaux du premier critère ne sont pas les mêmes pour chaque niveau du second critère.


Critères de classification croisés:

L'expérience présentée ci-dessus consiste à étudier le taux de cholestérol de façon à réaliser 3 prélèvements par jour sur les mêmes individus pendant trois jours. Les individus sont croisés aux jours.


Critères de classification hiérarchisés:

L'expérience présentée ci-dessus consiste à étudier le taux de cholestérol de façon à réaliser 3 prélèvements par jour sur des individus différents de jour en jour. Les individus sont hiérarchisés aux jours. Même si le plan expérimental n'a pas beaucoup de sens sur des individus humains, il pourrait avoir du sens en recherche si les individus étaient des souris et qu'il faille sacrifier les animaux pour réaliser les mesures aux différents jours.

Modèles et équation de l'analyse de la variance

Afin de compléter l'étude des ANOVA multiples, il est possible d'établir le modèle représentant l'ANOVA moyennant le respect de certaines conventions de notation pour l'écriture du modèle.

Soit X la mesure expérimentale ou observation, µ la moyenne générale de toutes les populations étudiées et E l'erreur résiduelle ou non contrôlée.

Sources de variation:

1. Effets globaux

  • Il y a autant d'effets globaux qu'il y a de critères de classification dans un modèle.
  • Chaque critère est identifié par une lettre, en commençant par la lettre A.
  • L'effet correspondant à un critère est identifié par la même lettre, minuscule si le critère est fixe (a), majuscule si le critère est aléatoire (A).
    • L'effet de chacun des n niveaux d'un critère est indicé par une lettre, en commençant par la lettre i (l'indice de l'effet du critère A est i, du critère B est j, etc.): Ai ou ai
    • Le nombre de niveaux de chaque critère est représenté par la lettre n indicée par la lettre qui désigne le critère (i = 1, ..., na; j = 1, ..., nb; etc.)
    • Le niveau d'un critère hiérarchisé à un ou plusieurs autres critères est représenté par la lettre du critère hiérarchisé, indicée par la lettre correspondant à ce critère, mais précédée par la ou les lettres du ou des critères auxquels il est hiérarchisé, placées entre parenthèses (si a est fixe, B est aléatoire et B est hiérarchisé à a, alors les effets s'écrivent comme suit: ai et B(i)j).
    • Pour l'erreur résiduelle E, l'indice varie de 1 jusque n, et l'effet correspondant est toujours hiérarchisé à tous les autres critères de classification: E(ij)n

2. Interactions

  • L'interaction ne peut exister qu'entre deux critères croisés
  • Il y a autant d'effets d'interaction qu'il y a de combinaisons de 2, 3, 4, ... critères croisés
  • L'interaction est aléatoire si au moins un des critères intervenant est aléatoire
  • Les indices d'une interaction sont ceux des critères inclus dans celle-ci.

3. Exemple

Soit une ANOVA à trois critères de classification:

  • un critère fixe (effet ai, avec i = 1, ..., na)
  • un critère aléatoire, hiérarchisé au premier (effet B(i)j, avec j = 1, ..., nb)
  • un second critère fixe (effet ck, avec k = 1, ..., nc)

Les interactions sont alors:

  • acik (fixe)
  • Bc(i)jk (aléatoire)

Le modèle s'écrit donc:

x(ijk)l = µ + ai + B(i)j + ck + acik + Bc(i)jk + E(ijk)l

L'équation de l'analyse de la variance décompose la somme des carrés des écart totaux (SCET) en ses différentes composantes:

SCET = SCEa + SCEB(a) + SCEc + SCEac + SCEBc + SCER

Exemples de résolutions d'exercices

Question: Etablir un schéma des expériences suivantes. Quels sont les critères de classification, combien y a-t-il de niveaux pour chacun des critères? Sont-ils fixes ou aléatoires? Quelles sont les relations entre eux ? Combien y a-t-il de répétitions indépendantes ? Etablir le modèle et l'équation de l'analyse de la variance.

Exemple 1:

Un test hématologique a été effectué sur 5 adultes normaux et 5 adultes atteints d'une maladie sanguine. A chaque individu, on injecte une quantité fixe d'un produit radioactif et on prélève, à différents temps (1, 3, 5 et 10 minutes), un échantillon de sang dont on mesure la radioactivité en cpm (coups par minute).

   
1'
3'
5'
10'
NORMAUX
adulte A
-
-
-
-
adulte B
-
-
-
-
adulte C
-
-
-
-
adulte D
-
-
-
-
adulte E
-
-
-
-
MALADES
adulte F
-
-
-
-
adulte G
-
-
-
-
adulte H
-
-
-
-
adulte I
-
-
-
-
adulte J
-
-
-
-

Effets:
Santé: ai, fixe, croisé avec Temps.
Individu: B(i)j, aléatoire, hiérarchisé à Santé, et croisé avec Temps.
Temps: ck , fixe, croisé avec Santé et Individu.

Interactions:
Entre Santé et Temps: acik
Entre Individu et Temps: Bc(i)jk

Modèle à trois critères de classification, sans répétitions [l=1]

x(ijk)l = µ + ai + B(i)j + ck + acik + Bc(i)jk

SCET = SCEa +SCEB(a) +SCEc + SCEac + SCEBc


Exemple 2:

Une tumeur est prélevée chez 4 souris. De chaque tumeur, on prélève 2 fragments quelconques sur lesquels on dénombre au microscope des cellules particulières. A la suite d'un traitement A, ces comptages ont été effectués à 3 temps successifs (1, 2 et 3 jours après l'administration du traitement) à partir des 4 mêmes souris.

 
JOUR 1
JOUR 2
JOUR 3
SOURIS 1

-

-

-

-

-

-

SOURIS 2

-

-

-

-

-

-

SOURIS 3

-

-

-

-

-

-

SOURIS 4

-

-

-

-

-

-

Effets:
Souris: Ai, aléatoire, croisé avec Jours.
Jour: bj, fixe, croisé avec Souris.

Interactions:
Entre Souris et Jour: Abij

Modèle à deux critères de classification, avec 2 répétitions [k=2]

x(ij)k = µ + Ai + bj + Abij + E(ij)k

SCET = SCEA +SCEb +SCEAb + SCER

 

Problèmes (9 groupes, deux problèmes)

1.1. Dans une étude portant sur la reproduction du goujon, l'impact de trois milieux piscicoles a été examiné : l'étang naturel, un bassin à température constante, un bassin à température et à éclairement constants. Dans chaque milieu, on a mesuré le poids des ovaires de 20 goujons adultes.

2.1. Un test hématologique a été effectué sur 5 adultes normaux et 5 adultes atteints d'une maladie sanguine. A chaque individu, on injecte une quantité fixe d'un produit radioactif et on prélève, à différents temps, un échantillon de sang dont on mesure la radioactivité en cpm.

3.1 Une tumeur est prélevée chez 4 souris. De chaque tumeur, on prélève 2 fragments quelconques sur lesquels on dénombre au microscope des cellules particulières. A la suite d'un traitement A, ces comptages ont été effectués à 3 temps successifs (jour 1, jour 2 et jour 3) à partir des 4 mêmes souris.

4.1 Trois laboratoires désirent comparer leurs résultats d'analyse de calcium dans différentes terres. Quatre prélèvements de terre ont été effectués au hasard dans trois régions, Ardenne, Condroz et Hesbaye. Chaque laboratoire a reçu 1/3 de chaque prélèvement sur lequel il a déterminé la teneur en calcium selon les 2 méthodes (M1 et M2) officiellement reconnues.

5.1 Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts A, B et C, et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site.

6.1 Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. Pour chaque rat, on mesure la quantité totale de nourriture (en kgs) ingérée sur un mois.

7.1 Pour fixer les quotas laitiers, on souhaite réaliser une estimation de la production laitière d'un cheptel. L'expérimentateur décide de prospecter trois régions au hasard. Dans chaque région, il recueille les statistiques de production de dix vaches prises au hasard, avec les mesures de production en été et en hiver pour chaque animal.

8.1 Un hydrobiologiste s'intéresse à la teneur en phosphates de deux lacs. A deux saisons différentes, il effectue 5 mesures indépendantes de la concentration en phosphates (microgrammes par litre)

9.1 Un biochimiste étudie l'influence de l'éthanol sur la teneur en graisse dans le foie chez le rat. Il constitue deux groupes de 5 rats: le premier reçoit une ration alimentaire normale et le second reçoit une ration alimentaire à laquelle il ajoute quotidiennement une quantité fixe d'alcool. Après quinze jours, il prélève le foie aux rats, l'homogénéise et y mesure la teneur en graisse sur 3 échantillons d'un gramme.

 

1.2 Un biochimiste désire comparer deux méthodes de dosage d'une enzyme hépatique. Il prélève le foie à 6 rats et sur chaque foie, après homogénéisation, il prend 4 échantillons dont deux sont analysés par la méthode I et les deux autres par la méthode II.

2.2 Dans un département où coexistent trois variétés d'une même plante, un laboratoire de botanique a étudié si la concentration en chlorophylle des feuilles dépendait de la variété et de l'avancement de la saison. Par variété et par mois, on a mesuré la concentration en chlorophylle sur quatre plantes.

3.2. Un expérimentateur désire tester deux drogues quant à leur effet sur le nombre de lymphocytes chez la souris. Il choisit au sein de 7 portées (une portée = des souris issues de même père et mère), 3 souris, la première servant de contrôle, les deux autres recevant respectivement les drogues A et B. Après quelque temps, il mesure le nombre de lymphocytes en milliers par mm3 de sang.

4.2. Un laboratoire d'analyse de terres désire comparer trois types de sondes pédologiques (S1, S2 et S3) dans les deux types de sols de la région. A cette fin, il prélève 4 échantillons par type de sol et par sonde et mesure le P2O5 dans chaque échantillon de terre.

5.2. Afin de déterminer les facteurs agissant sur la production d'interféron par les lymphocytes, on a planifié l'expérience suivante: quatre taureaux géniteurs de race Pie Rouge sont croisés chacun avec 5 vaches. Sur le veau issu de chaque croisement, on effectue un prélèvement de sang dont on isole les lymphocytes. La moitié des lymphocytes obtenus est stimulée par la lectine CON A et l'autre moitié par la lectine PHA. Après un certain temps, on mesure la quantité d'interféron produite.

6.2. Dans l'étude écologique d'une rivière, 5 stations ont été choisies aléatoirement en amont d'une ville, et 5 stations ont été choisies aléatoirement en aval. Dans chaque station au mois de juillet et au mois d'octobre, on effectue 5 prélèvements d'eau dont on mesure le pH.

7.2. Dans les serres modernes, il est possible d'obtenir un air climatisé dont la température et l'humidité sont contrôlées de façon précise. Dans le but d'étudier l'effet de la vitesse de l'air pulsé sur la croissance de deux espèces florales, l'expérience suivante a été réalisée:trois serres identiques ont été réglées à des vitesses d'air pulsé différentes: V1, V2 et V3. Craignant un effet "paroi", on a mesuré la croissance des plantes à deux endroits différents: au centre et sur le bord sud. A chaque endroit, on mesure après 4 jours, la vitesse de croissance de 10 plantes de chaque espèce.

8.2. Afin de déterminer les facteurs agissant sur la production d'interféron par les lymphocytes, l'expérience suivante a été réalisée: 4 taureaux géniteurs sont choisis respectivement pour la race Pie Rouge et pour la race Bleu Blanc Belge. Chaque taureau est croisé à 5 vaches. Sur le veau issu de chaque croisement, on prélève 3 échantillons de sang dont on mesure la quantité d'interféron produite par les lymphocytes.

9.2. Un vétérinaire désire tester l'action de deux vermifuges sur la croissance pondérale de bovins. Dans un cheptel infesté, il constitue 3 groupes de 15 taurillons: le premier sert de groupe témoin, le deuxième reçoit le vermifuge 1 et le troisième le vermifuge 2. Chaque mois (de novembre à février), chaque animal passe à la pesée et l'on mesure son accroissement en poids en kilos.

Bonus. Un vétérinaire désire tester l'action de deux vermifuges sur la croissance pondérale de bovins. Dans un cheptel infesté, il constitue 4 groupes de 15 taurillons: le premier reçoit le vermifuge 1 à la dose de 200 mgr/kg/jour, le deuxième reçoit le vermifuge 1 à la dose de 400 mgr/kg/jour, le troisième reçoit le vermifuge 2 à la dose de 200 mgr/kg/jour et le quatrième reçoit le vermifuge 2 à la dose de 400 mgr/kg/jour. Chaque mois (de novembre à février), chaque animal passe à la pesée et l'on mesure son accroissement en poids en kilos.

Exercices de contextes biologiques ou bio-médicaux

1. Dans une étude portant sur la reproduction du goujon, l'impact de trois milieux piscicoles a été examiné : l'étang naturel, un bassin à température constante, un bassin à température et à éclairement constants. Dans chaque milieu, on a mesuré le poids des ovaires de 20 goujons adultes. réponse

2. Un test hématologique a été effectué sur 5 adultes normaux et 5 adultes atteints d'une maladie sanguine. A chaque individu, on injecte une quantité fixe d'un produit radioactif et on prélève, à différents temps (1, 3 et 5 minutes), un échantillon de sang dont on mesure la radioactivité en cpm (coups par minute). réponse 

3. Une tumeur est prélevée chez 4 souris. De chaque tumeur, on prélève 2 fragments quelconques sur lesquels on dénombre au microscope des cellules particulières. A la suite d'un traitement A, ces comptages ont été effectués à 3 temps successifs (1, 2 et 3 jours après l'administration du traitement) sur chaque fragment. réponse 

4. Trois laboratoires désirent comparer leurs résultats d'analyse de calcium dans différentes terres. Quatre prélèvements de terre ont été effectués au hasard dans trois régions, Ardenne, Condroz et Hesbaye. Chaque laboratoire a reçu 1/3 de chaque prélèvement sur lequel il a déterminé la teneur en calcium selon les 2 méthodes (M1 et M2) officiellement reconnues. réponse 

5. Un ornithologue s'intéresse à l'évolution d'une espèce d'oiseaux répartie dans trois sites géographiquement distincts (l'observatoire des fagnes, le zwin, et les lacs de l'Eau d'Heure), et plus particulièrement aux différences morphologiques engendrées par les mécanismes d'isolement. A cet effet, il a mesuré la longueur des ailes (en mm) de 10 oiseaux capturés sur chaque site. réponse 

6. Une industrie pharmaceutique désire tester trois stimulants de l'appétit (S1, S2, S3) en mesurant la capacité d'absorption de nourriture chez le rat. Quatre groupes de 12 rats sont constitués: le premier servant de témoin, les trois autres recevant respectivement les stimulants S1, S2 et S3. On mesure la quantité de nourriture (en kg) ingérée sur un mois. réponse 

7. Pour fixer les quotas laitiers, on souhaite réaliser une estimation de la production laitière annuelle d'un cheptel. L'expérimentateur décide de prospecter trois régions au hasard. Dans chaque région, il recueille les statistiques de production de dix vaches prises au hasard, avec les mesures de production en été et en hiver pour chaque animal. réponse 

8. Un hydrobiologiste s'intéresse à la teneur en phosphates de deux lacs (Lac de Buchenwald, Lac principal des barrages de l'Eau d'Heure). A deux saisons différentes (été, hiver), il effectue 5 mesures indépendantes de la concentration en phosphates (microgrammes par litre). réponse 

9. Un biochimiste étudie l'influence de l'éthanol sur la teneur en graisse dans le foie chez le rat. Il constitue deux groupes de 5 rats: le premier reçoit une ration alimentaire normale et le second reçoit une ration alimentaire à laquelle il ajoute quotidiennement une quantité fixe d'alcool. Après quinze jours, il prélève le foie aux rats, l'homogénéise et y mesure la teneur en graisse sur 3 échantillons d'un gramme. réponse 

10. Un biochimiste désire comparer deux méthodes de dosage d'une enzyme hépatique. Il prélève le foie à 6 rats et sur chaque foie, après homogénéisation, il prend 4 échantillons dont deux sont analysés par la méthode I et les deux autres par la méthode II. réponse 

11. Dans une des serres du département de botanique, plusieurs variétés de bananier coexistent. Pour étudier si la concentration en chlorophylle des feuilles de bananier dépendait de la variété et de l'avancement de la saison, un étudiant, sur la période allant de mars à juin, a choisi 3 variétés au hasard, et pour chacune d'entre elles, a mesuré chaque mois la concentration en chlorophylle sur quatre plantes.
Rédigez le modèle dans le cas où les plantes sont différentes chaque mois, puis dans celui ou elles sont chaque fois identiques. réponse 

12. Un chercheur désire tester deux nouvelles molécules (XB512, XZ321) potentiellement immuno-stimulantes quant à leur effet sur le nombre de lymphocytes chez la souris. Il choisit au sein de 7 portées (une portée = des souris issues de même père et de même mère), 3 souris, la première servant de contrôle, les deux autres recevant respectivement les deux molécules à tester. Après quelque temps, il mesure le nombre de lymphocytes en milliers par mm3 de sang. réponse 

13. Un laboratoire d'analyse de terres désire comparer trois types de sondes pédologiques (S1, S2 et S3) dans les deux types de sols de la région (sableuse, argileuse). A cette fin, il prélève 4 échantillons par type de sol et par sonde et mesure le P2O5 dans chaque échantillon de terre. réponse 

14. Afin de déterminer les facteurs agissant sur la production d'interféron β par les lymphocytes bovins, on a planifié l'expérience suivante: quatre taureaux géniteurs de race Pie Rouge sont croisés chacun avec 5 vaches. Sur le veau issu de chaque croisement, on effectue un prélèvement de sang dont on isole les lymphocytes. La moitié des lymphocytes obtenus est stimulée par la lectine CON A et l'autre moitié par la lectine PHA. Après un certain temps, on mesure la quantité d'interféron β produite. réponse 

15. Dans l'étude écologique d'une rivière, 5 stations ont été choisies aléatoirement en amont d'une ville, et 5 stations ont été choisies aléatoirement en aval. Dans chaque station au mois de juillet et au mois d'octobre, on effectue 5 prélèvements d'eau dont on mesure le pH. réponse 

16. Dans les serres modernes, il est possible d'obtenir un air climatisé dont la température et l'humidité sont contrôlées de façon précise. Dans le but d'étudier l'effet de la vitesse de l'air pulsé sur la croissance de deux espèces florales (Strelitzia reginae et Beloperone guttata), l'expérience suivante a été réalisée:trois serres identiques ont été réglées à des vitesses d'air pulsé différentes: V1, V2 et V3. Craignant un effet "paroi", on a mesuré la croissance des plantes à deux endroits différents: au centre et sur le bord sud. A chaque endroit, on mesure après 4 jours, la vitesse de croissance de 10 plantes de chaque espèce. réponse 

17. Afin de déterminer les facteurs agissant sur la production d'interféron β par les lymphocytes, l'expérience suivante a été réalisée: 4 taureaux géniteurs de race Pie Rouge et 4 taureaux de race Blanc Bleu Belge ont été sélectionnés. Chaque taureau est croisé avec 5 vaches. Sur le veau issu de chaque croisement, on prélève 3 échantillons de sang dont on mesure la quantité d'interféron β produite par les lymphocytes. réponse 

18. Un vétérinaire désire tester l'action de deux vermifuges sur la croissance pondérale de bovins. Dans un cheptel infesté, il constitue 3 groupes de 15 taurillons: le premier sert de groupe témoin, le deuxième reçoit le vermifuge 1 et le troisième le vermifuge 2. Chaque mois (de novembre à février), chaque animal passe à la pesée et l'on mesure son accroissement en poids en kilos. réponse 

19. Un vétérinaire désire tester l'action de deux vermifuges sur la croissance pondérale de bovins. Dans un cheptel infesté, il constitue 4 groupes de 15 taurillons: le premier reçoit le vermifuge 1 à la dose de 200 mgr/kg/jour, le deuxième reçoit le vermifuge 1 à la dose de 400 mgr/kg/jour, le troisième reçoit le vermifuge 2 à la dose de 200 mgr/kg/jour et le quatrième reçoit le vermifuge 2 à la dose de 400 mgr/kg/jour. Chaque mois (de novembre à février), chaque animal passe à la pesée et l'on mesure son accroissement en poids en kilos. réponse

Correction des exercices de contextes biologiques ou bio-médicaux

L'ANOVA 2 croisée fixe

Outils pédagogiques complémentaires

Définition et but de la technique

La technique décrite dans ce module n'est applicable que dans le cas où:

  • il existe na niveaux du facteur A
  • il existe nb niveaux du facteur B
  • les critères de classification sont fixes et s'écrivent: ai et bj
  • Pour chacune des nanb catégories, on prélève de façon indépendante un échantillon aléatoire de taille n. Les n observations d'un échantillon étant hiérarchisées aux nanb catégories, on prendra soin d'indiquer par des parenthèses la hiérarchisation de l'indice k aux indices (i,j). Une observation quelconque est notée X(ij)k
  • les critères de classification fixes ai et bj sont croisés selon le schéma expérimental suivant:
  FACTEUR A
    1 ... i ... na
FACTEUR B 1 X(11)1 ... X(i1)1   X(na1)1
... ... ... ... ...
X(11)n ... X(i1)n   X(na1)n
... ... ... ...   ...
... ... ... ... ...
... ... ...   ...
j X(1j)1 ... X(ij)1   X(naj)1
... ... ... ... ...
X(1j)n ... X(ij)n   X(naj)n
... ... ... ...   ...
... ... ... ... ...
... ... ...   ...
nb X(1nb)1 ... X(inb)1   X(nanb)1
... ... ... ... ...
X(1nb)n ... X(inb)n   X(nanb)n

Dans le cadre de ce cours, nous ne considèrerons que les expériences composées d'échantillons possédant tous un effectif n identique.

Dans un modèle d'ANOVA2 croisée fixe, l'équation s'écrit:

X(ij)k = µ + ai +bj + abij +E(ij)k

Exemple

Un physiologiste compare l'effet de trois doses d'un même médicament à 4 temps différents. Pour chaque dose et chaque temps, il choisit aléatoirement 3 animaux :

 

temps 1

temps 2

temps 3

temps 4

dose 1

x1

x10

x19

x28

x2

x11

x20

x29

x3

x12

x21

x30

dose 2

x4

x13

x22

x31

x5

x14

x23

x32

x6

x15

x24

x33

dose 3

x7

x16

x25

x34

x8

x17

x26

x35

x9

x18

x27

x36

 

But: vérifier si chacun des facteurs (temps et doses) retenus a ou non une influence sur la caractéristique mesurée et si ces facteurs agissent de manière additive (1+1=2) ou bien en synergie (1+1>2).

Calculs dans MS Excel


Tableau des moyennes et des variances

A partir du tableau décrit à la page précédente, on peut calculer les moyennes et les variances.

 

temps 1

temps 2

temps 3

temps 4

moyenne mdoses

dose 1

mt1d1

S2t1d1

mt2d1

S2t2d1

mt3d1

S2t3d1

mt4d1

S2t4d1

md1

dose 2

mt1d2

S2t1d2

mt2d2

S2 t2d2

mt3d2

S2t3d2

mt4d2

S2t4d2

md2

dose 3

mt1d3

S2t1d3

mt2d3

S2t2d3

mt3d3

S2t3d3

mt4d3

S2t4d3

md3

moyenne mtemps

mt1

mt2

mt3

mt4

m générale

 


Tableau d'ANOVA

A condition d'avoir démontré par un test de Hartley que les variances pouvaient être considérées comme homogènes, il est possible de construire le tableau d'ANOVA suivant:

 

SCE

dl

CM

Fobservé

totale

voir ANOVA I

factorielle

voir ANOVA I

dose

SCEdose

nbre dose - 1

SCEdose/dldose

CMdose/CMR

temps

SCEtemps

nbre tps - 1

SCEtemps/dltemps

CMtemps/CMR

interaction

= SCEF -SCEdose - SCEtemps

dlF-dldose-dltemps

SCEinter/dlinter

CMinter/CMR

résiduelle

voir ANOVA I

 


SCE dose

SCEdose = nindiv_par_dose* somme.carre.ecarts(mdoses)

 


SCE temps

SCEtemps = nindiv_par_tps * somme.carre.ecarts(mtemps)

 


Les questions posées par l'ANOVA 2 croisée fixe:

Niveau Factoriel:

Est-il possible de mettre en évidence la présence d'au moins une moyenne différente des autres?

Niveau dose:

Est-il possible de mettre en évidence un effet global de la dose (tous les temps confondus)?

Niveau temps:

Est-il possible de mettre en évidence un effet global du temps (toutes les doses ensemble)?

Niveau Interaction:

Est-il possible de mettre en évidence la présence d'une interaction entre la dose et le temps?

Il y a absence d'interaction si la dose agit de la même façon à chacun des temps ou encore si l'effet du temps est semblable à chaque dose (parallélisme)?

 

 

Généralisation des modèles d'ANOVA

Outils pédagogiques complémentaires

Introduction

Comme vu précédemment, le protocole d'une expérience peut être modélisé en une équation mathématique.

Ce chapitre nous permet de déterminer, par un test statistique de Fisher-Snedecor, si chacun des composants de variance de l'équation a une influence significative sur le paramètre étudié.

Méthodologie :

  1. après avoir modélisé sous forme d'équation le protocole expérimental, déterminer l'espérance du carré moyen correspondant à chaque composant de cette équation.
  2. calculer le Fobservé pour chaque composant.
    Rappelons que le test F est un rapport de carrés moyens. Au numérateur nous aurons le CM du composant et au dénominateur le CM du terme correspondant au carré moyen étudié.
  • Si le composant a une influence significative, il devra être pris en compte dans la modélisation.
  • Dans le cas contraire, l'équation de base pourra être simplifiée et le composant sera éliminé. Il ne faudra donc plus tenir compte de ce critère pour expliquer le paramètre étudié.

Contexte

Énoncé de l'expérience:

Pour fixer les quotas laitiers de la Région wallonne, l'expérimentateur prospecte l'Ardenne, le Condroz et la Hesbaye. Dans chaque région, il recueille les statistiques de production de 4 vaches prises au hasard, en été et en hiver. Sur chacune de ces vaches, il réalise 3 traites pour mesurer la quantité de lait.


Représentation de l'expérience:

 
été
hiver
traite 1
traite 2
traite 3
traite 1
traite 2
traite 3
Ardenne
vache 1
qtité lait
         
vache 2            
vache 3            
vache 4            
Condroz
vache 1            
vache 2            
vache 3            
vache 4            
Hesbaye
vache 1            
vache 2            
vache 3            
vache 4            

Critères:

Région: ai où i = 3
- critère fixe avec 3 niveaux
- croisé au critère Saison

Vache: B(i)j où j = 4
- critère aléatoire avec 4 niveaux
- hiérarchisé au critère Région
- croisé au critère Saison

Saison: ck où k = 2
- critère fixe à 2 niveaux
- croisé au critère Région
- croisé au critère Vache

Nombre de réplicats: l = 3

 

Équation:

x(ijk) l = mx + ai + B(i)j + ck + acik + Bc(i)jk + E(ijk)l

La production laitière pourrait donc être influencée par:

  • la Région seule: ai
  • la Vache seule: B(i)j
  • la Saison seule: ck
  • l'interaction Région / Saison: acik
  • l'interaction Vache / Saison: Bc(i)jk
  • la variabilité entre les 3 traites (variabilité résiduelle non testable)

  ne pas oublier de tenir compte des erreurs de mesures E(ijk)l (important quand la mesure est répétée).

Règle 1

Espérances des carrés moyens de chaque composant

Application de la règle 1

  • δ2 our les critères fixes
  • S2 pour les critères aléatoires

Si l'indice:

  • n'est pas epris dans le membre en tête de ligne, mettre la valeur de l'indice en question
  • est repris dans le membre en tête de ligne, se rapporte à un critère fixe (minuscule) et n'est pas entre parenthèses, mettre la valeur 0
  • est repris dans le membre en tête de ligne, ne répond pas aux conditions précédentes, mettre la valeur 1

Exemple

   
i = 3
j = 4
k = 2
l = 3
δ2a
ai
0
4
2
3
S2B
B(i)j
1
1
2
3
δ2c
ck
3
4
0
3
δ2ac
acik
0
4
0
3
S2Bc
Bc(i)jk
1
1
0
3
S2
E(ijk)l
1
1
1
1

 

Règle 2

Espérances des carrés moyens de chaque composant:

Application de la règle 2

Considérer uniquement les sources de variabilité qui ont au moins tous les indices repris en tête de ligne.

Exemple

pour acik, pour prendre les δ2 et S2, il faut que les deux indices i et k soient présents

 
i = 3
j = 4
k = 2
l = 3
 
δ2a
ai
0
4
2
3
δ2a
S2B
 
δ2ac
S2Bc
S2
S2B
B(i)j
1
1
2
3
 
S2B
   
S2Bc
S2
δ2c
ck
3
4
0
3
   
δ2c
δ2ac
S2Bc
S2
δ2ac
acik
0
4
0
3
     
δ2ac
S2Bc
S2
S2Bc
Bc(i)jk
1
1
0
3
       
S2Bc
S2
S2
E(ijk)l
1
1
1
1
         
S2

Règle 3

Espérances des carrés moyens de chaque composant

Application de la règle 3

  1. Masquer les colonnes correspondant aux indices qui ne sont pas entre parenthèses.
  2. Pondérer chaque terme par le produit des indices non masqués.

 Exemple

 
i = 3
j = 4
k = 2
l = 3
 
δ2a
ai
0
4
2
3
24δ2a
6S2B
 
2ac
0S2Bc
1S2
S2B
B(i)j
1
1
2
3
 
6S2B
   
0S2Bc
1S2
δ2c
ck
3
4
0
3
   
36δ2c
2ac
3S2Bc
1S2
δ2ac
acik
0
4
0
3
     
12δ2ac
3S2Bc
1S2
S2Bc
Bc(i)jk
1
1
0
3
       
3S2Bc
1S2
S2
E(ijk)l
1
1
1
1
         
1S2

Conclusion

Détermination des tests d'hypothèses et conclusions

Rappelons que l'intérêt de cette démarche est de déterminer quels composants de l'équation initiale sont pertinents pour expliquer la production laitière.

Chaque composant devra donc faire l'objet d'un test d'hypothèses et donc il faut, pour chacun de ces composants, calculer un F observé.

x(ijk)l = mx + ai + B(i)j + ck + acik + Bc(i)jk + E(ijk)l

Application de la règle 4 pour déterminer les degrés de liberté de chaque test d'hypothèses

Effectuer le produit de la valeur maximale de tous les indices représentés en tête de ligne, après avoir retiré 1 à ceux qui ne sont pas entre parenthèses.

Exemple

 
i=3
j=4
k=2
l=3
 
dl
δ2a
ai
0
4
2
3
24δ2a
6S2B
 
2ac
0S2Bc
1S2
2
S2B
B(i)j
1
1
2
3
 
6S2B
   
0S2Bc
1S2
9
δ2c
ck
3
4
0
3
   
36δ2c
2ac
3S2Bc
1S2
1
δ2ac
acik
0
4
0
3
     
12δ2ac
3S2Bc
1S2
2
S2Bc
Bc(i)jk
1
1
0
3
       
3S2Bc
1S2
9
 
S2
E(ijk)l
1
1
1
1
         
1S2
48

Test 1:

H0: δ2a = 0
H1 : δ2a ≠ 0

si δ2a = 0, l'espérance du CMa devrait être égale au CMB = 6S2B + 1S2. Le rapport entre le CMa et le CMB devrait être proche de 1.

Donc, TeX Embedding failed!

  1. si le test est significatif, alors δ2a ≠ 0
    alors, il faut maintenir ai dans l'équation finale puisque la région influence la production laitière de manière significative
  2. si le test est non significatif, alors δ2a = 0
    alors, nous pouvons supprimer ai de l'équation finale puisque la région n'influence pas la production laitière

Test 2:

H0: S2B = 0
H1 : S2B ≠ 0

    si S2B = 0, L'espérance du CMB devrait être égale au CMR = 1S2. Le rapport entre le CMB et le CMR devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors S2B ≠ 0
      alors, il faut maintenir B(i)j dans l'équation finale puisque le critère vache influence la production laitière de manière significative
    2. si le test est non significatif, alors S2B = 0
      alors, nous pouvons supprimer B(i)j de l'équation finale puisque le critère vache n'influence pas la production laitière

Test 3:

H0: δ2c = 0
H1 : δ2c ≠ 0

    si δ2c = 0,  l'espérance du CMc devrait être égale au CMBc =3S2Bc + 1S2. Le rapport entre le CMc et le CMBc devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors δ2c ≠ 0
      alors, il faut maintenir ck dans l'équation finale puisque la saison influence la production laitière de manière significative
    2. si le test est non significatif, alors δ2c = 0
      alors, nous pouvons supprimer ck de l'équation finale puisque la saison n'influence pas la production laitière

Test 4:

H0: δ2ac = 0
H1 : δ2ac ≠ 0

    si δ2ac = 0, l'espérance du CMac devrait être égale au CMBc =3S2Bc + 1S2. Le rapport entre le CMac et le CMBc devrait être proche de 1.
    donc, TeX Embedding failed!

    si le test est significatif, alors δ2ac ≠ 0
    alors, il faut maintenir acik dans l'équation finale puisque l'interaction région/saison influence la production laitière de manière significative

    si le test est non significatif, alors δ2ac = 0
    alors, nous pouvons supprimer acik de l'équation finale puisque l'interaction région/saison n'influence pas la production laitière


Test 5:

H0: S2Bc = 0
H1 : S2Bc ≠ 0

    si S2Bc = 0, l'espérance du CMBc devrait être égale au CMR = 1S2. Le rapport entre le CMBc et le CMR devrait être proche de 1.
    donc, TeX Embedding failed!

    1. si le test est significatif, alors S2Bc ≠ 0
      alors, il faut maintenir Bc(i)jk dans l'équation finale puisque l'interaction vache/saison influence la production laitière de manière significative
    2. si le test est non significatif, alors S2Bc = 0
      alors, nous pouvons supprimer Bc(i)jk de l'équation finale puisque l'interaction vache/saison n'influence pas la production laitière