Attendibilità dei test medici: cosa dice il calcolo delle probabilità

venerdì 8 maggio 2020


Ben sappiamo tutti quanto la medicina moderna abbia fatto affidamento su test e scansioni. Negli Usa i medici ordinano oltre 4 miliardi di esami diagnostici ogni anno. Sono diventati più sofisticati e più facili da eseguire con l’avanzare della tecnologia e sono essenziali per aiutare i medici a capire cosa potrebbe esserci di sbagliato nei loro pazienti. Ma varie ricerche hanno dimostrato che molti medici fraintendono i risultati dei test o pensano che i test siano più accurati di loro. I medici in particolare non riescono a capire come funzionano i falsi positivi, il che significa che prendono decisioni mediche cruciali basate su ipotesi errate secondo cui i pazienti soffrono di malattie che probabilmente, invece, non hanno. Quando lo facciamo senza comprendere la scienza del rischio e della probabilità, aumentiamo inaccettabilmente le possibilità di fare la scelta sbagliata.

Gli esami diagnostici si qualificano per due parametri di laboratorio, che hanno una corrispondenza nelle ricerche che si fanno in Fisica: la sensibilità S (sensitivity, in Fisica si chiama allo stesso modo), che indica la quantità minima di agenti patogeni (pensiamo al caso del coronavirus) che il test è in grado di rivelare, e la specificità F (in Fisica si chiama risoluzione), ossia la capacità di distinguere l’agente patogeno che c’interessa da altri consimili (la specie dei Corona comprende altri ceppi). Un test poco accurato comporta il rischio di etichettare come positivo un paziente che non ha dentro di sè la patologia cercata (e quindi difetta di specificità) oppure quello di un risultato negativo su di un paziente portatore della malattia, difetta cioè di sensibilità. Naturalmente si obietterà che un certo test dovrebbe essere considerato come solo un elemento di un quadro clinico-diagnostico, in cui altri elementi dànno indicazioni sulla patologia in atto e possono quindi guidare il medico nella scelta della terapia appropriata. Ma non è sempre così e la pandemia attuale ha dimostrato, oltre all’incompetenza di tanti “esperti” fra cui quelli dell’Organizzazione mondiale della sanità, anche quanto sia importante il ruolo degli asintomatici nella trasmissione del virus.

Un esempio illuminante viene dall’esperienza dei test per l’Aids: un test “ottimale” ha una specificità F = 99 per cento, ossia su 100 persone che non hanno il virus solo una viene erroneamente riconosciuta come “positivo”. Ora, se su una popolazione, poniamo, di 50 milioni di abitanti solo 100mila hanno la malattia, è facile calcolare la probabilità P di ottenere un “falso positivo” testando una persona presa a caso, e cioè: P = numero di falsi positivi / (numero di falsi positivi + numero di veri positivi) = 499.000 / 499.000 + 100.000 = 83% enorme! Un test sub-optimale (specificità F = 94%) darebbe una probabilità di falso positivo P = 96%, praticamente quasi tutta la popolazione.

Nel caso del coronavirus il numero dei contagiati è molto più elevato, benché la malattia non sia così letale come l’Aids, fortunatamente. Stando ai dati dell’Istituto Superiore di Sanità aggiornati al 4 maggio i casi di Covid-19 in Italia sono 209.254, su una popolazione di 60,3 milioni. Non si hanno notizie certe circa la specificità dei test (tamponi e sierologici) ma assumendo molto ottimisticamente che sia pari a quella del test Aids ottimale, avremmo, usando la stessa semplice formula suddetta, una probabilità di falso positivo P = 74 per cento! Sappiamo però che la cifra reale dei contagi è più elevata dei casi accertati, benché le stime fatte non siano molto d’accordo fra loro, ma se anche lo fosse di un fattore 10, avremmo P = 22 per cento, una percentuale non proprio trascurabile.

Molto più tranquillizzante è la situazione dei casi di “falso negativo”: un test con una sensibilità S = 99% darebbe solo 20mila casi negativi su un totale di 2 milioni di contagi, e quindi la probabilità di errore è solo P = 20.000/(20.000 + 58,3 milioni) = 0,034 per cento, decisamente trascurabile. Qui il rischio non è tanto di natura probabilistica, quanto piuttosto nella possibilità che il test intervenga troppo presto rispetto al momento del contagio, quando il virus non si è ancora moltiplicato in quantità sufficiente a superare la soglia di sensibilità del test, la quale, è bene precisare, viene misurata solo su base statistica, ossia su un campione di persone infette che però non costituiscono un insieme omogeneo. Inoltre pesano fattori come il modo con cui viene effettuato il tampone (naso, retronaso, gola) e il trattamento ed il trasporto del tampone. Così, secondo certe stime, la sensibilità vera probabilmente è molto più bassa, fino al 75 per cento, e quindi, con le cifre già usate per il calcolo, avremmo una probabilità di “falso negativo” P = 0.9%, comunque piccola. Solo nel caso, un po’ estremo, di un 50 per cento della popolazione contagiata, avremmo P (falso negativo) = 20 per cento, abbastanza significativa, ma utilizzando un test con una S = 99% si ridurrebbe a P = 1% soltanto.

Combinando sensibilità e specificità di un test e assumendo valori decisamente ottimali (ma poco realistici, secondo la pratica medica), S = 99% = F, la probabilità di “azzeccare” il virus su di una popolazione che ne è affetta in una percentuale A = 3% (questo invece è un valore molto più realistico) è data da P = S x A / (S x A + (1-F) x (1-A) = 75%. È chiaro che con test di qualità inferiore e/o con un minor numero di contagi la probabilità sarebbe certo più bassa e ben lontana dalla certezza.

In entrambi casi la soluzione più ovvia è quella di ripetere il test, il che da un punto di vista meramente statistico porterebbe la suddetta probabilità P dal 75 al 99,6 per cento, praticamente la certezza. Ma altri fattori, sistematici e casuali, entrano in gioco, come già detto, che limitano fortemente le nostre capacità di predizione. Così può capitare che persone già sintomatiche siano state trovate più volte negative ai test e siano poi decedute, come nel caso triste della sedicenne francese Julie oppure siano risultate per quattro volte negative al tampone e positive invece al test sierologico.

(*) Presidente di Astri 


di Sergio Bartalucci (*)