Tests diagnostiques qualitatifs

Outils pédagogiques complémentaires

Principe

Un test diagnostique est, en médecine, un test qui permet de poser un diagnostic, c'est à dire distinguer, pour une affection donnée, les individus malades des individus sains.

La validité d'un test diagnostique dépend de plusieurs paramètres comme la sensibilité, la spécificité, les valeurs prédictives, les rapports de vraisemblance, ...

L'analyse de la validité d'un test diagnostique doit tenir compte d'un certain nombre de biais et de problèmes (test de référence imparfait, personnes non-vérifiées, ...).

La comparaison de deux analyses de résultats par la même méthode diagnostique peut également constituer une information intéressante. Cela est rendu possible par le calcul de la concordance entre les deux résultats (index Kappa).

Table de contingence

Les résultats d'un test diagnostique peuvent être représentés sous forme d'une table de contingence qui permet de croiser le résultat du test (positif ou négatif) avec le statut du sujet (malade ou non-malade).

Si l'événement A est "être malade" et l'événement B est "être positif au test", la table de contingence reprenant leurs fréquences (et non leurs probabilités) se construit comme suit:

  A A*  
B A ∩ B A* ∩ B B
B* A ∩ B* A* ∩ B* B*
  A A*  

 

Quatre combinaisons sont possibles:

a) un vrai positif (VP) est une personne qui est malade et qui présente un test positif.
b) un faux positif (FP) est une personne qui n'est pas malade et qui présente un test positif.
c) un faux négatif (FN) est une personne qui est malade et qui présente un test négatif.
d) un vrai négatif (VN) est une personne qui n'est pas malade et qui présente un test négatif.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

 

  Malade Non-malade  
Positif VP FP VP + FP
Négatif FN VN FN + VN
  VP + FN FP + VN N

On note N l'ensemble de tous les résultats obtenus.

Sensibilité et spécificité

Sensibilité

La sensibilité (Se) est la probabilité qu'un test réalisé sur une personne malade se révèle positif; autrement dit, que le test soit positif sachant que la personne est malade.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

La sensibilité correspond donc au nombre de personnes malades et positives au test (vrais positifs) parmi l'ensemble des personnes malades.

TeX Embedding failed!

Spécificité

La spécificité (Sp) est la probabilité qu'un test réalisé sur une personne saine se révèle négatif; autrement dit, que le test soit négatif sachant que la personne n'est pas malade.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

La spécificité correspond donc au nombre de personnes non-malades et négatives au test (vrais négatifs) parmi l'ensemble des personnes non-malades.

TeX Embedding failed!

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Quelles sont la sensibilité et la spécificité de ce test ?

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

TeX Embedding failed! Une sensibilité de 0,78 signifie que, lorsque le patient est malade, il y a 78% de chance que le test de dépistage de la maladie soit positif.

TeX Embedding failed! Une spécificité de 0,88 signifie que, lorsque le patient n'est pas malade, il y a 88% de chance que le test de dépistage de la maladie soit négatif.

Valeurs prédictives

Lorsque le médecin reçoit le résultat (positif ou négatif) d'un test pratiqué sur un de ses patients, il a besoin de connaitre la probabilité que son patient soit malade ou non. 

Valeur prédictive positive

La valeur prédictive positive (VPP) est la probabilité que le patient, dont le test est positif, soit effectivement malade.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

La valeur prédictive positive correspond donc au nombre de personnes malades et positives au test (vrais positifs) parmi l'ensemble des personnes positives au test.

TeX Embedding failed!

Valeur prédictive négative

La valeur prédictive négative (VPN) est la probabilité que le patient, dont le test est négatif, ne soit pas malade.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

La valeur prédictive négative correspond donc au nombre de personnes non-malades et négatives au test (vrais négatifs) parmi l'ensemble des personnes négatives au test.

TeX Embedding failed!

Les valeurs prédictives, positive et négative, dépendent de la prévalence de la maladie.

 

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Quelles sont les valeurs prédictives positives et négatives ?

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

TeX Embedding failed! Une valeur prédictive positive de 0,90 signifie que le patient a 90% de risque d'être malade quand le test de dépistage de la maladie est positif.

TeX Embedding failed! Une valeur prédictive négative de 0,75 signifie que le patient a 75% de chance de ne pas être atteint de la maladie quand le test de dépistage de cette maladie est négatif.

Index de Youden

L'index de Youden (Y) est une mesure de la précision de la méthode de diagnostic. Il dépend de la spécificité et de la sensibilité du test mais pas de la prévalence de la maladie.

TeX Embedding failed!

L'index de Youden est compris entre 0 (la méthode de diagnostic n'est pas efficace) et 1 (la méthode est parfaite).

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test.

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

TeX Embedding failed! et TeX Embedding failed!

TeX Embedding failed!

 

Efficacité diagnostique

L'efficacité diagnostique est la proportion de résultats corrects dans l'ensemble des résultats du test.
Les résultats corrects sont les personnes dont le diagnostic posé suite au test correspond à son statut; il s'agit donc des vrais positifs et des vrais négatifs.

  Malade Non-malade  
Positif a b a + b
Négatif c d c + d
  a + c b + d N

TeX Embedding failed!

 

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Quelle est l'efficacité diagnostique de ce test ?

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

TeX Embedding failed!

Une efficacité diagnostique de 0,825 signifie que 82,5% des résultats obtenus lors du test sont corrects.

Rapports de vraissemblance

Rapport de vraisemblance positif

Le rapport de vraisemblance positif (RV(+)) est le rapport entre la probabilité de présenter un test positif quand la personne est malade et la probabilité de présenter un test positif quand la personne n'est pas malade.

TeX Embedding failed!

Rapport de vraisemblance négatif

Le rapport de vraisemblance négatif (RV(-)) est le rapport entre la probabilité de présenter un test négatif quand la personne est malade et la probabilité de présenter un test négatif quand la personne n'est pas malade.

TeX Embedding failed!

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Quels sont les rapports de vraisemblance, positifs et négatifs, de ce test ?

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

On sait que la sensibilté est de 78% (TeX Embedding failed!) et que la spécificité est de 88% (TeX Embedding failed!).

TeX Embedding failed!
Un rapport de vraisemblance positif de 6,5 signifie qu'il y a six fois et demi plus de chance de présenter un test positif lorsque la personne est malade que lorsque la personne n'est pas malade.

TeX Embedding failed!
Un rapport de vraisemblance négatif de 0,25 signifie qu'il y a quatre fois plus de chance de présenter un test négatif lorsque la personne n'est pas malade que lorsque la personne est malade.

Théorème de Bayes

Le théorème de Bayes permet de déterminer les valeurs prédictives d'un test en connaissant la prévalence de la maladie, la sensibilité et la spécificité du test.

La formule générale du théorème de Bayes peut être retrouvée à partir de la loi des probabilités conditionnelles.

Loi des probabilités conditionnelles: TeX Embedding failed!

Or, il est possible de décomposer les membres de la fraction:

  • au numérateur: TeX Embedding failed!
  • au dénominateur: TeX Embedding failed! 

La formule générale du théorème de Bayes est donc:

TeX Embedding failed!

Soient les événements A "être malade " et B "être positif au test" et sachant que p(A) est la prévalence de la maladie (notée p), p(B/A) est la sensibilité et p(B*/A*) est la spécificité, alors le théorème de Bayes, appliqué aux tests diagnostiques, devient:

TeX Embedding failed!
TeX Embedding failed!

Biais de vérification

Pour qu'une personne soit classée comme malade ou non-malade, il est nécessaire d'utiliser une autre méthode de dépistage de cette maladie ayant déjà fait ses preuves (test de référence).
Toutefois, la vérification par ce test de référence peut ne pas être réalisée chez tous les participants de l'étude. Cela est particulièrement le cas si le test de référence est invasif ou risqué.

Ainsi, une personne ayant subi le nouveau test de dépistage peut être classée dans une des trois catégories suivantes:

  • vérifiée et malade (on est certain du résultat du test);
  • vérifiée et non-malade (on est certain du résultat du test);
  • non-vérifiée (on n'a pas la certitude que le résultat est correct; donc, souvent, on ne les prend pas en compte).
  Vérifié Non-vérifié
  Malade Non-malade Total
Positif a b t1 u1
Négatif c d t0 u0

On note:

  • t1, l'ensemble des personnes positives et vérifiées;
  • t0, l'ensemble des personnes négatives et vérifiées;
  • u1, l'ensemble des personnes positives mais non-vérifiées;
  • u0, l'ensemble des personnes négatives mais non-vérifiées.

Bien qu'elles ne puissent être classées comme malades ou non-malades, les personnes non-vérifiées doivent être prises en compte lors du calcul de la sensibilité et de la spécificité. Ainsi, les formules utilisées sont modifiées et deviennent:

TeX Embedding failed!
TeX Embedding failed!

 

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Toutefois, 5 personnes positives et 20 personnes négatives au test n'ont pas pu être classées comme malades ou non-malades. En tenant compte de ces personnes non-vérifiées, quelles sont la sensibilité et la spécificité de ce test ?

  Vérifié Non-vérifié
  Malade Non-malade Total
Positif 90 10 100 5
Négatif 25 75 100 20

TeX Embedding failed!
TeX Embedding failed!

La sensibilité du test est de 75,9% tandis que sa spécificité est de 89,6%.
Si on ne tient pas compte des personnes non-vérifiées, la sensibilité et la spécificité apparentes valent respectivement 78% et 88%.

On constate donc que, si on néglige le biais de vérification, la sensibilité réelle du test est sur-estimée tandis que la spécificité réelle est sous-estimée.

Imperfection du test de référence

Le test de référence qui a permis de classer les sujets comme malade ou non-malade n'est pas parfait; il présente une sensibilité et une spécificité propre. Il est indispensable de tenir compte de cette imperfection pour déterminer la sensibilité et la spécificité du test étudié.

Si SeR et SpR sont respectivement la sensibilité et la spécificité du test de référence, les formules utilisées pour le calcul de la sensibilité et de la spécificité réelles du test étudié deviennent:

TeX Embedding failed!
TeX Embedding failed!

Exemple

Afin d'étudier la validité d'un nouveau test de dépistage d'une maladie, 115 personnes malades et 85 personnes qui ne sont pas malades subissent ce test: 90 personnes sont malades et positives au test tandis que 75 sont saines (non-malades) et négatives au test. Le test qui a permis de classer les participants de cette étude en malade et non-malade a une sensibilité de 0,90 et une spécificité de 0,95. En tenant compte de l'imperfection du test de référence, quelles sont la sensibilité et la spécificité du test étudié ?

  Malade Non-malade  
Positif 90 10 100
Négatif 25 75 100
  115 85 200

TeX Embedding failed!
TeX Embedding failed!

La sensibilité et la spécificité réelles du test étudié sont respectivement de 81% et 100%.

Résultats incertains

Lorsqu'un test est réalisé, il est possible qu'une partie des résultats ne soient ni positifs, ni négatifs; ils sont alors considérés comme incertains.

La table de contingence construite pour illustrer les résultats est adaptée à cette situation. Deux nouvelles possibilités apparaissent:

  • i1, le nombre de résultats incertains chez les personnes malades;
  • i0, le nombre de résultats incertains chez les personnes saines.
  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

 

Plusieurs approches sont possibles pour tenir compte des résultats incertains lors de la détermination de la sensibilité et de la spécificité du test étudié.

 

Approche 1: situation la plus défavorable.

Dans cette approche, les résultats incertains sont considérés comme:

  • négatifs lors du calcul de la sensibilité,
  • positifs lors du calcul de la spécificité.

Les formules utilisées pour la détermination de la sensibilité et de la spécificité sont adaptées à cette situation.

La sensibilité devient le rapport entre le nombre de personnes malades et positives et l'ensemble des personnes malades.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

La spécificité devient le rapport entre le nombre de personnes saines (non-malades) et négatives et l'ensemble des personnes saines.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

 

Approche 2: intervalle entre deux bornes.

Lors de cette approche, la borne inférieure est calculée dans la situation la plus défavorable tandis que la borne supérieure est calculée dans la situation la plus favorable. Ainsi, les résultats incertains sont considérés comme:

  • positifs lors du calcul de la sensibilité;
  • négatifs lors du calcul de la spécificité.

La borne supérieure de la sensibilité est le rapport entre le nombre de personnes malades et positives, ou considérées comme positives, et l'ensemble des personnes malades.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

La borne supérieure de la spécificité est donc le rapport entre le nombre de personnes saines (non-malades) et négatives, ou considérées comme négatives, et l'ensemble des personnes saines.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

Ainsi, la sensibilité et la spécificité réelles du test sont comprises entre une borne inférieure (cf approche 1) et une borne supérieure.÷

TeX Embedding failed!
TeX Embedding failed!

 

Approche 3: rendements.

Cette approche consiste à déterminer la sensibilité et la spécificité sans tenir compte des résultats incertains mais en précisant la proportion de résultats certains (rendements).

La sensibilité est accompagnée de la valeur du rendement positif du test. Ce rendement correspond au rapport entre le nombre de résultats certains chez les malades et l'ensemble des personnes malades.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

La spécificité est accompagnée de la valeur du rendement négatif du test. Ce rendement correspond au rapport entre le nombre de résultats certains chez les personnes saines (non-malades) et l'ensemble des personnes saines.

  Malade Non-malade
Positif a b
Incertain i1 i0
Négatif c d
  a + i1 + c b + i0 + d

TeX Embedding failed!

Index Kappa

La comparaison des résultats d'une même méthode diagnostique interprétés par deux personnes différentes, ou par une même personne mais à des moments différents, est possible grâce à la détermination de la concordance entre les résultats. L'index Kappa permet de quantifier le niveau de cette concordance.

Lors de la première interprétation (test A), les résultats sont soit positifs, soit négatifs. Lors de la seconde interprétation (test B), par une autre personne ou par la même personne mais à un moment différent, les résultats sont également positifs ou négatifs. Ainsi, quatre combinaisons de résultats apparaissent:

(a) résultat positif au test A et positif au test B;
(b) résultat positif au test A et négatif au test B;
(c) résultat négatif au test A et positif au test B;
(d) résultat négatif au test A et négatif au test B.

Ces combinaisons peuvent être représentées sous forme d'un tableau croisant le résultat obtenu au test A avec celui obtenu au test B.

    Test B  
    Positif Négatif  
Test A Positif a b n1
Négatif c d n2
    n3 n4 N

On note:

 

  • n1, l'ensemble des résultats positifs lors de la première interprétation (test A);
  • n2, l'ensemble des résultats négatifs lors de la première interprétation (test A);
  • n3, l'ensemble des résultats positifs lors de la seconde interprétation (test B);
  • n4, l'ensemble des résultats négatifs lors de la seconde interprétation (test B);
  • N, l'ensemble de tous les résultats.

Les résultats concordent lorsque les deux interprétations amènent à la même conclusion; c'est le cas dans les situations a (test A et test B positifs) et d (test A et test B négatifs).
La comparaison de la fréquence de ces résultats concordants par rapport à l'ensemble des résultats permet d'obtenir la proportion de réponses concordantes observée (Po).

    Test B  
    Positif Négatif  
Test A Positif a b n1
Négatif c d n2
    n3 n4 N

TeX Embedding failed!

Toutefois, une partie de la concordance observée est en fait due au hasard; c'est la concordance aléatoire ou la proportion de résultats concordant par chance (Pc). Cette proportion correspond au rapport entre la somme des produits marginaux des résultats concordants et le carré du nombre total de résultats.

    Test B  
    Positif Négatif  
Test A Positif a b n1
Négatif c d n2
    n3 n4 N

TeX Embedding failed!

L'index Kappa (κ), qui quantifie le niveau de concordance réel entre des résultats, est déterminé en tenant compte des concordances observée et aléatoire.

TeX Embedding failed!

Plus la valeur de l'index Kappa se rapproche de 1, plus la concordance des résultats est importante. Celle-ci est qualifiée par différents adjectifs en fonction de la valeur de l'index Kappa.

Accord Index Kappa
Excellent ≥ 0,80
Bon 0,60 ≤ κ < 0,80
Moyen 0,40 ≤ κ < 0,60
Médiocre 0,20 ≤ κ < 0,40
Mauvais 0 ≤ κ < 0,20
Exécrable < 0

L'index Kappa est sensible à la prévalence de la maladie.

Exercices

Exercice 1

Afin de diagnostiquer la présence d'une appendicite chez des patients présentant des douleurs abdominales aigues, on réalise une échographie de la région abdominale. Parmi les 255 patients chez lesquels l'échographie était positive, 235 présentaient effectivement une appendicite. Toutefois, 75 des 585 patients dont l'échographie était négative, présentaient également une appendicite.

  1. Représentez les données sous forme d'une table de contingence.
  2. Quelle est la spécificité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
  3. Quelle est la sensibilité du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
  4. Quelle est la valeur prédictive positive du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?
  5. Quelle est la valeur prédictive négative du diagnostique de l'appendicite par échographie abdominale ? Que signifie la valeur obtenue ?

Exercice 2

Une firme désire commercialiser un nouveau test de dépistage d'infection urinaire pour les femmes enceintes (bandelettes urinaires). Afin de vérifier son efficacité, ce nouveau produit est testé sur des échantillons d'urine contenant un taux de leucocytes inférieur à la normale (pas d'infection) et supérieur à la normale (infection). Les résultats de ce test se présentent comme décrits dans le tableau suivant.

  Infection Pas d'infection
Test positif 27 3
Test négatif 5 75

Toutefois, en plus des résultats positifs et négatifs, 4 tests ont été considérés comme douteux; 2 chez les femmes présentant une infection et 2 chez les femmes ne présentant pas d'infection urinaire.

Représentez l'ensemble des résultats sous forme d'une table de contingence et déterminez la sensibilité et la spécificité du test en tenant compte des résultats incertains.

Exercice 3

Afin de déceler la présence de calculs rénaux chez des patients se plaignant de douleurs caractéristiques intenses, des radiographies des voies urinaires sont réalisées et interprétées par deux médecins. Sur les 150 clichés analysés, 80 sont jugés positifs par les deux médecins tandis que 15 sont considérés comme positifs par le premier médecin mais négatifs par le second médecin. Ce dernier juge comme positives 90 radiographies.

Déterminez la concordance entre les résultats des deux médecins.