Valeur prédictive d’un test de dépistage – Ou comment un test avec une précision de 90% peut générer un résultat positif qui a 68% de chances d’être faux

Dans mon billet précédent, je parlais d’une étude récemment parue dans Nature Medicine qui rapportait l’identification d’un panel de lipides dont la concentration sanguine pouvait prédire si un individu allait développer des troubles de la mémoire (ou un début de maladie d’Alzheimer) dans les deux ou trois ans.

Mon but en écrivant ce billet était de décrire comment les individus inclus dans l’analyse qui a servi à identifier le panel de lipides avaient été sélectionnés, et d’ainsi mettre en valeur deux points importants:
1) les résultats de l’étude s’appliquent à un groupe d’individus répondant à un certain nombre de critères et ne sont donc pas directement généralisables à l’ensemble de la population,
2) les lipides à la base du test de dépistage ont été identifiés à partir de l’existence de différences dans leurs concentrations sanguines entre des groupes d’individus dont les effectifs étaient relativement faibles, et il est donc important de vérifier que ces différences sont également observables avec de plus grands groupes d’individus avant d’affirmer que ces lipides sont des biomarqueurs valides.

J’ai ensuite remarqué que la plupart des articles de presse rapportant les résultats de cette étude non seulement donnaient l’impression que les chercheurs avaient mis au point un test sanguin pour prédire la maladie d’Alzheimer et que ce test était opérationnel ou allait bientôt l’être, mais aussi mentionnaient souvent que ce test pouvait prédire la maladie d’Alzheimer “avec une précision de 90%”.

Je peux voir deux problèmes au fait de donner une information telle que “précision de 90%” sans fournir plus de détails ou d’explications.

1. Qu’est-ce que cela veut dire exactement?

La précision de 90% fait référence à la sensibilité de 90% et à la spécificité de 90% que les auteurs de l’étude ont rapportées pour leur test sanguin. Sommes-nous tous supposés savoir cela, et savoir ce que sensibilité et spécificité veulent dire dans le cas d’un test de dépistage? Ceci m’amène au deuxième problème:

2. La sensibilité et la spécificité d’un test ne représentent pas la même chose que sa valeur prédictive.

Encore une fois, sommes-nous tous supposés savoir ce qu’est la valeur prédictive d’un test et comment la calculer? Il me semble que non, et dans ce cas, dire qu’un test de dépistage peut prédire une maladie avec une précision de 90% sans fournir plus d’explications a de bonnes chances d’induire le lecteur en erreur quant à la vraie valeur prédictive du test.

Maintenant, vous pouvez vous demander s’il est vraiment important d’informer un lecteur non spécialiste de la précision d’un test et de sa valeur prédictive. Après tout, on pourrait considérer cela comme des détails réservés aux professionnels et sans importance pour le lecteur profane. Mais il me semble que oui, c’est important, et ce pour la simple et bonne raison que l’utilité d’un test de dépistage ne se juge pas sur sa seule précision (sensibilité et spécificité), mais aussi sur sa valeur prédictive, et qu’on ne peut donc pas se faire une bonne opinion sur le sujet si l’on n’a pas l’essentiel des informations en main.

  • Sensibilité et spécificité

Prenons le test sanguin proposé par les auteurs de l’étude de Nature Medicine comme exemple. Les auteurs rapportent une sensibilité de 90% et une spécificité de 90%. (Je suppose ici que les résultats de l’étude ont été reproduits dans de plus grandes cohortes d’individus, et que le test peut effectivement identifier les personnes qui vont développer des troubles de la mémoire dans les deux ou trois ans).

Imaginez maintenant que vous ayez une machine à voyager dans le temps. Vous vous rendez trois ans dans le futur et faites une liste de 100 personnes qui ont des troubles de la mémoire (mais qui n’en avaient pas trois ans auparavant) et de 100 personnes qui n’ont aucun trouble de la mémoire. Vous revenez ensuite dans le présent, traquez ces 200 personnes, et leur faites passer le test sanguin.
– Parmi les 100 personnes qui d’après votre liste vont développer des troubles de la mémoire, 90 auront un test positif (sensibilité de 90%).
Il y aura donc 10 personnes qui auront un test négatif et qui pourtant développeront des troubles: ce sont des faux négatifs.
– Parmi les 100 personnes qui d’après votre liste n’auront pas de troubles de la mémoire dans trois ans, 90 auront un test négatif (spécificité de 90%).
Il y aura donc 10 personnes qui auront un test positif et qui pourtant ne développeront pas de troubles: ce sont des faux positifs.

En d’autres termes:
la sensibilité d’un test de dépistage indique le pourcentage de gens malades qui seront correctement identifiés comme tels par le test (test positif)
-> plus la sensibilité est élevée, moins il y a de faux négatifs
la spécificité indique le pourcentage de gens non malades qui seront correctement identifiés comme tels par le test (test négatif)
-> plus la spécificité est élevée, moins il y a de faux positifs.

Sensibilité et spécificitéRevenons à notre exemple. Il se trouve que les machines à voyager dans le temps n’existent pas (hélas). Nous ne savons donc pas qui va être malade et qui ne va pas l’être. La seule chose à notre disposition, c’est le résultat du test sanguin, et à partir de ça, nous voulons savoir si la personne sera malade ou pas. C’est là que la valeur prédictive du test entre en jeu.

  • Valeur prédictive d’un test de dépistage

La valeur prédictive d’un test s’intéresse, en quelque sorte, à l’envers du problème par rapport à la sensibilité et à la spécificité. Par exemple:
– dans le cas de la sensibilité, on regarde un groupe de gens malades, et on veut savoir quelle est la proportion de ce groupe qui aura un test positif,
– dans le cas de la valeur prédictive positive, on regarde un groupe de gens qui ont tous un test positif, et on veut savoir quelle est la proportion de ce groupe qui va vraiment être malade.

En d’autres termes:
la valeur prédictive positive d’un test de dépistage indique le pourcentage de gens ayant un test positif qui sont vraiment malades (c’est la probabilité d’être malade quand le test est positif)
la valeur prédictive négative indique le pourcentage de gens ayant un test négatif qui ne sont effectivement pas malades (c’est la probabilité de ne pas être malade quand le test est négatif).

Valeurs prédictivesÀ ce stade, il est important de savoir que la sensibilité et la spécificité sont deux caractéristiques intrinsèques d’un test de dépistage: elles vont par exemple dépendre des aspects techniques du test, mais elles ne seront pas affectées par la prévalence de la maladie dans la population (la prévalence étant la proportion de gens ayant la maladie dans la population à un moment donné). Par contre, la valeur prédictive d’un test, elle, dépendra toujours de la prévalence de la maladie dans la population qui utilise le test (évidemment, elle dépend aussi de la sensibilité et de la spécificité du test).

Revenons à notre exemple de test sanguin pour prédire le développement de troubles de la mémoire. Cette fois-ci, nous n’allons pas regarder notre groupe imaginaire de 200 personnes sélectionnées grâce à notre voyage dans le futur, mais la population réelle dans le temps présent. Dans l’étude de Nature Medicine, environ 5% des individus recrutés (âgés de 70 ans ou plus) ont développé des troubles de la mémoire: prenons ces 5% comme estimation de la proportion de gens âgés de 70 ans ou plus qui vont développer des troubles de la mémoire et utilisons-la dans notre exemple.

Si l’on regarde 1000 personnes (de 70 ans ou plus) se rendant chez leur médecin et effectuant le test sanguin qui prédit la maladie d’Alzheimer, alors:
– parmi ces 1000 personnes, 50 vont développer des troubles de la mémoire, et 950 ne vont pas en développer (prévalence de 5%)
– parmi les 50 personnes qui seront atteintes de troubles, 45 vont avoir un test positif et 5 un test négatif (sensibilité de 90%)
– parmi les 950 personnes qui ne seront pas atteintes, 855 vont avoir un test négatif et 95 un test positif (spécificité de 90%)
– au total, sur les 1000 tests passés, il y aura donc 45+95=140 tests positifs, mais seulement 45 seront des vrais positifs.

La valeur prédictive positive du test représente la proportion de gens ayant un test positif qui seront effectivement atteints de la maladie.
-> Dans notre exemple, la valeur prédictive positive est 45/140, soit 32%.
En d’autres termes, si votre test de dépistage est positif, la probabilité d’être effectivement atteint de troubles de la mémoire est d’environ 1 sur 3. Ce qui veut aussi dire que deux tiers des personnes ayant un test positif ne développeront pas de troubles de la mémoire.

La valeur prédictive négative du test représente la proportion de gens ayant un test négatif qui ne seront effectivement pas atteints de la maladie.
-> Dans notre exemple, la valeur prédictive négative est 855/(855+5), soit 99%.
En d’autres termes, si votre test de dépistage est négatif, il y a seulement une chance sur 100 pour que vous développiez des troubles de la mémoire dans les deux ou trois ans.

Enfin, il est intéressant de noter que pour n’importe quel test de dépistage (avec une sensibilité et une spécificité intrinsèques, fixes), plus la maladie est rare et plus la valeur prédictive du test est faible.
-> Dans notre exemple de test sanguin pour prédire la maladie d’Alzheimer, si l’on s’intéresse maintenant à des gens un peu plus jeunes, on sait que des troubles de la mémoire apparaîtront moins fréquemment (la maladie étant associée au vieillissement); prenons une prévalence de 1% dans ce groupe de gens plus jeunes: la valeur prédictive positive du test (qui a toujours “90% de précision”) est maintenant seulement d’environ 8%, ce qui veut dire que 92% des personnes ayant un test positif ne développeront en fait pas de troubles de la mémoire dans les deux ou trois ans qui suivent.

  • Précision, valeur prédictive et conclusion

Pour résumer, le test sanguin proposé par les auteurs de l’étude parue dans Nature Medicine pour prédire le développement de troubles de la mémoire et de la maladie d’Alzheimer deux ou trois ans avant l’apparition des symptômes a effectivement une précision de 90% au sens où il a une sensibilité de 90% et une spécificité de 90%.
Par contre, ce test a une valeur prédictive positive d’environ 32% pour des personnes âgées de 70 ans ou plus (avec la prévalence de la conversion “mémoire normale -> troubles de la mémoire” estimée à 5% pour ce groupe d’âge). Cela signifie que seulement un tiers des personnes ayant un test positif développeront des troubles de la mémoire dans les quelques années qui suivent.

Je vais maintenant revenir sur une question posée plus haut dans ce billet: pourquoi devrait-on informer le public de la précision et de la valeur prédictive d’un test? (Cela s’applique en fait à n’importe quel test de dépistage, pas seulement à celui annoncé récemment dans les journaux comme le nouveau test permettant de prédire la maladie d’Alzheimer.)

Déjà, il est possible que les gens voient les choses différemment si on leur dit “ce test est précis à 90%” ou si on leur dit aussi quelque chose comme “deux tests positifs sur trois seront des faux positifs”.

Mais surtout, la valeur prédictive d’un test de dépistage est particulièrement importante s’il n’existe pas d’autre test qui peut être utilisé pour confirmer ou infirmer le résultat obtenu (ce qui est actuellement le cas pour un test qui voudrait prédire la maladie d’Alzheimer trois ans avant que les symptômes n’apparaissent). Si, en plus, il n’existe pas de moyen efficace pour empêcher la maladie de se développer, ni pour la guérir ou même ralentir sa progression, alors la valeur prédictive positive du test est d’autant plus importante qu’on ne souhaite pas alarmer beaucoup de gens pour rien (dans un tel cas, on pourrait aussi se demander si un test pour prédire la maladie est une bonne idée de toute façon). Enfin, la valeur prédictive positive d’un test pour une maladie donnée est également très importante si les traitements disponibles ont des effets secondaires toxiques considérables, ou si les examens nécessaires à la confirmation du diagnostic sont potentiellement dangereux: dans un tel cas, on voudra une valeur prédictive positive aussi élevée que possible afin d’éviter de soumettre à des manipulations dangereuses des personnes qui n’en avaient pas besoin.

 

Aussi sur le C@fé des sciences:
Les probabilités conditionnelles (Bayes level 1), par David sur Science étonnante.
Il se trouve que je ne suis la première sur le C@fé des sciences à faire un cours sur la valeur prédictive d’un test de dépistage, mais dans le billet de David, vous trouverez en plus un rappel fort utile de quelques notions de base en probabilité.

Ailleurs:
Blood Test Accuracy Not Easily Measured, on MedPage Today.
Article en anglais sur le cas du test pouvant prédire la maladie d’Alzheimer récemment rapporté dans Nature Medicine. L’auteur note que beaucoup de journalistes, voire certains professionnels de la santé, n’ont pas une bonne compréhension des mesures statistiques qui définissent un test de dépistage, et poursuit en détaillant le calcul simple qui permet de passer de sensibilité et spécificité à valeur prédictive.
Je n’ai malheureusement pas trouvé d’article équivalent en français (certes je n’ai peut-être pas cherché assez longtemps, mais pour comparaison, la même recherche en version anglophone m’a très vite retourné des liens pertinents).
Sensibilité et spécificité, Wikipédia

 

Publicités

Une réflexion sur “Valeur prédictive d’un test de dépistage – Ou comment un test avec une précision de 90% peut générer un résultat positif qui a 68% de chances d’être faux

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s