|
|
Scenari > Numeri > Quando i numeri ingannano | |||||||||||||
|
||||||||||||||
|
![]() |
|||||||||||||
|
Gli interventi a proposito della gestione dell’incertezza clinica di Davide Luciani (Luciani, 2006) e di Vittorio Girotto e Michel Gonzalez (Girotto & Gonzalez, 2006) sollevano due differenti problemi: uno è il problema della validità di un ragionamento esperto che da premesse che contengono frequenze statistiche concluda alla probabilità del caso singolo; l’altro è il problema di come rappresentare tale ragionamento nella maniera che sia più efficace per consentire a persone non esperte nel calcolo delle probabilità di arrivare alle medesime conclusioni dell’esperto. È opportuno tenere distinti questi due problemi per dissipare, da un lato, il timore espresso da Luciani che il tentativo di semplificare il problema inferenziale usando il modello di rappresentazione efficace di Gigerenzer (Gigerenzer, 2003), o quello di Girotto (Girotto, 2004), conduca a un uso distorto delle prove scientifiche, e per mostrare, d’altro lato, come Girotto e Gonzalez, nella loro risposta, si complichino la vita in maniera non necessaria. Il primo problema, quello che riguarda l’applicabilità di probabilità basate su dati statistici a un caso individuale ha a che fare con “l’annoso problema della classe di riferimento”, per usare le parole del filosofo della scienza Wesley Salmon (Salmon 1992, p. 123), ed è un problema ben noto agli epistemologi fin da quando Hempel propose il suo modello della spiegazione statistico-induttiva negli anni Sessanta (Hempel, 1986). Immaginiamo che l’esperto, nel nostro caso un medico, abbia a disposizione dei dati statistici circa l’affidabilità di un test per una certa malattia, dati che sono stati stimati su una certa popolazione, chiamiamola la “classe di riferimento” A: in questa classe una persona malata ha una probabilità del 75% di avere una reazione positiva al test, contro una probabilità del 12,5% per una persona sana (un falso positivo). L’esperto deve giudicare, sulla base delle informazioni specifiche che possiede sul suo paziente, se questi possa essere assimilato, sotto tutti gli aspetti rilevanti, a un qualsiasi individuo della classe di riferimento A, in modo che i dati sull’affidabilità del test stimati per quella popolazione possano essere usati per questo particolare paziente. Se l’esperto giudica che questo è il caso, allora può esprimere in maniera scientificamente corretta il “peso” che un risultato positivo del test ha per l’ipotesi che il paziente abbia la malattia nei termini di quello che gli statistici chiamano il “quoziente di verosimiglianza” (likelihood ratio): (75% : 12,5%) = 6. Ciò significa che un risultato positivo del test va a favore dell’ipotesi malattia, perché un risultato positivo è sei volte più probabile se il paziente è malato di quanto non lo sia se è sano. Naturalmente, un risultato negativo va a favore dell’ipotesi che il paziente non abbia la malattia: (25% : 87,5%) = 1 : 3,5. Ciò significa che un risultato negativo è tre volte e mezzo più probabile se il paziente è sano. Si noti come questa misura del peso della prova sia del tutto indipendente dal valore della frequenza di base della malattia: questa indipendenza della likelihood ratio è legata al fatto che “le caratteristiche biologiche, che spiegano la positività e la negatività di un test in presenza o meno di malattia, sono di gran lunga più stabili delle caratteristiche epidemiologiche, che coincidono con la proporzione di malati in una determinata popolazione” (Luciani, 2006). Tale indipendenza dalle probabilità a priori è anche la ragione principale per cui il calcolo del rapporto di verosimiglianza è il modo migliore con cui uno scienziato forense possa presentare al vaglio del tribunale il peso di una prova scientifica, come per esempio un’analisi del DNA (Taroni et al., 2006). Se poi l’esperto possiede anche dei dati statistici che riguardano la frequenza della malattia in una data popolazione, chiamiamola la “classe di riferimento” B, allora deve giudicare se le informazioni che ha sul suo paziente siano tali da poterlo considerare come appartenente anche a questa classe, in modo da poter usare la frequenza della malattia in quella popolazione, ad esempio il 4%, come stima della probabilità a priori che quel particolare paziente sia malato. Nuovamente, se l’esperto giudica che questo è il caso, allora può esprimere in maniera scientificamente corretta come la prova modifichi le probabilità delle ipotesi calcolando la “ragione di scommessa” a posteriori (posterior odds), cioè il rapporto delle probabilità a posteriori delle due ipotesi alternative. Questo calcolo si esegue moltiplicando il quoziente di verosimiglianza per la ragione di scommessa a priori (prior odds), che è il rapporto delle probabilità a priori delle due ipotesi alternative (Lindley, 1990): 6 × (4% : 96%) = 3 : 12 = 1 : 4. Ciò significa che, dato un risultato positivo del test, l’ipotesi che il paziente sia malato resta quattro volte meno probabile dell’ipotesi che non lo sia. Infatti, calcolando le probabilità a posteriori usando il teorema di Bayes in forma estesa, e non in termini di ragioni di scommessa, queste probabilità stanno nel rapporto uno a quattro: 20% e 80%. A questo punto vanno fatte due osservazioni. La prima è che questi numeri compaiono come conseguenza dei giudizi dell’esperto che il paziente appartiene alle classi di riferimento A e B: se, per qualche fondata ragione, l’esperto ritenesse che il paziente non sia assimilabile a quelle popolazioni, allora dovrebbe usare dei numeri diversi, basati su suoi giudizi di probabilità personale oppure basati su statistiche che facciano riferimento a differenti popolazioni da lui ritenute più simili al suo paziente, così soddisfacendo il requisito della specificità massimale di Hempel. La seconda osservazione è che la ragione di scommessa a posteriori è data precisamente dal rapporto dei due “magici” numeri interi di Gigerenzer e Girotto: 3 e 12. Ovvero Gigerenzer e Girotto non fanno altro che rappresentare in maniera più facile ed intuitiva (partendo ovviamente da presupposti teorici differenti) il calcolo delle ragioni di scommessa a posteriori fatto da un esperto. Queste due osservazioni prese congiuntamente comportano che le rappresentazioni semplificate di Gigerenzer e di Girotto sono rappresentazioni scientificamente corrette dei giudizi dell’esperto. I numeri 3 e 12 compaiono solamente in conseguenza del fatto che l’esperto ha giudicato il paziente assimilabile alle popolazioni A e B, per le quali è vero che il test ha un’affidabilità del 75% e un margine di errore del 12,5%, e la frequenza di base della malattia è del 4%. Se l’esperto dovesse invece giudicare che il suo paziente è assimilabile, per le sue caratteristiche, ad una diversa popolazione C nella quale la frequenza della malattia è pari, diciamo, al 9%, nulla impedisce di costruire un modello del problema sempre basato sul numero delle possibilità, che corrisponda approssimativamente al calcolo della ragione di scommessa a posteriori: 6 × (9% : 91%) = 59 : 100 = 1 : 1,7. Certamente, se si vuole semplificare l’inferenza usando solo numeri interi (possibilità) si dovrà presentare un risultato approssimato, ma qua entriamo nel merito del secondo, e differente, problema menzionato all’inizio, quello della comunicazione fra l’esperto, che deve naturalmente essere in grado di eseguire il calcolo esatto, e il paziente non esperto. Come, a mio avviso giustamente, osservano Girotto e Gonzalez in fondo al loro intervento, se lo scopo principale è quello di fornire al paziente informazioni rilevanti, possiamo ben sacrificare la precisione e comunicare al paziente i numeri 6 e 10, invece che 59 e 100, e dire che la probabilità che non abbia la malattia è quasi il doppio della probabilità che ce l’abbia, dato l’esito positivo del test. Ma questo è, ovviamente, un problema differente dal problema di assegnare il paziente alla corretta classe di riferimento e, una volta fatta questa assegnazione, se si usa un modello semplificato per presentare l’inferenza, nessuna distorsione del ragionamento scientifico corretto viene operata, a meno di un arrotondamento. Nella pratica statistica gli arrotondamenti sono moneta corrente e quanta approssimazione possa essere tollerata dipende dallo scopo. Quanto detto sopra vale anche per il caso in cui la malattia sia rappresentata come una variabile graduata, cioè una variabile discreta a tre valori (forma acuta della malattia, forma lieve; malattia assente), la variabile “malattia” sia correlata a una variabile binaria “fattori di rischio” (rischio alto associato a una maggior frequenza della forma acuta; rischio basso associato a una maggior frequenza della forma lieve) e l’affidabilità del test dipenda dal grado della malattia: se è acuta, il test è sempre positivo, se è lieve, è positivo una volta su due (Girotto & Gonzalez, 2006). Girotto e Gonzalez affermano che in questo caso, a differenza del caso precedente in cui la variabile “malattia” era binaria (malato, non malato), non sarebbe possibile usare i valori statistici rilevati in una data popolazione per altre popolazioni. A parte il fatto che, a certe condizioni, è possibile effettuare questa estensione, il problema in discussione è quello dell’utilizzazione di dati statistici per un particolare individuo e, per questo problema, non ci sono differenze di principio fra i due casi. Supponiamo di avere i seguenti dati per una certa popolazione: il 40% degli individui ad alto rischio sono malati in forma acuta e il 20% in forma lieve; la popolazione ad alto rischio costituisce solo il 10% della popolazione rilevante complessiva, per cui i malati fra gli individui ad alto rischio costituiscono solo il (10% × 60%) = 6% della popolazione complessiva. Fra gli individui a basso rischio il 10% è malato in forma acuta e il 20% in forma lieve. L’affidabilità del test è come si è detto sopra: se la forma è acuta, il risultato è positivo nel 100% dei casi, se è lieve lo è nel 50% dei casi; dobbiamo avere anche dei dati per i falsi positivi, per cui supponiamo che ci sia un 25% di falsi positivi. Immaginiamo adesso che l’esperto giudichi che il paziente, per le sue caratteristiche personali, sia ad alto rischio; se questo è il giudizio dell’esperto, allora nulla osta alla costruzione per la popolazione ad alto rischio di un modello alla Girotto e Gonzalez nel quale le possibilità sono le seguenti: forma acuta e positivo = 4, forma acuta e negativo = 0, forma lieve e positivo = 1, forma lieve e negativo = 1, sano e positivo =1, sano e negativo = 3. Di seguito riporto il calcolo delle ragioni di scommessa a posteriori, dato un risultato positivo del test, per coppie di ipotesi alternative, calcolo messo a confronto, a destra, con il semplice rapporto delle possibilità: acuto e positivo/lieve e positivo = (1:50%) × (40%:20%) = 2 × 2 = 4; possibilità: 4 a 1 acuto e positivo/sano e positivo = (1:25%) × (40%:40%) = 4 × 1 = 4; possibilità: 4 a 1 lieve e positivo/sano e positivo = (50%:25%) × (20%:40%) = 2 × 0,5 = 1; possibilità: 1 a 1 Calcoli analoghi possono essere fatti se il paziente viene invece considerato a basso rischio. Qualora si voglia confrontare l’ipotesi che il paziente sia malato, senza distinguere fra forma acuta e forma lieve, versus l’alternativa non malato, occorre addizionare i quozienti di verosimiglianza nella formula estesa, compito non elementare per il non esperto: malato e positivo/sano e positivo = (83%:25%) × (60%:40%) = 3,32 × 1,5 ? 5; ma semplicemente addizionare le possibilità nel modello semplificato: (forma acuta e positivo = 4) + (forma lieve e positivo = 1) = 5; esano e positivo = 1; ovvero 5 a 1. Elementare, Watson! Paolo Garbolino (pgarboli@iuav.it) Università IUAV di Venezia, Convento delle Terese 30123 Venezia Bibliografia Gigerenzer, G. (2003). Quando i numeri ingannano. Milano, Cortina. Girotto, V. (2004). Il ragionamento probabilistico ingenuo. Res Cogitans, 18 novembre. Girotto, V. & Gonzalez, M. (2006). Sulla gestione dell’incertezza clinica. Res Cogitans, 10 marzo. Hempel, C. (1986). Aspetti della spiegazione scientifica. Milano, Il Saggiatore. Lindley, D. (1990). La logica della decisione. Milano, Il Saggiatore. Luciani, D. (2006). Gestire l’incertezza. Res Cogitans, 4 febbraio. Salmon, W. (1992). 40 anni di spiegazione scientifica. Padova, Franco Muzzio. Taroni F., Aitken, C., Garbolino, P., & Biedermann, A. (2006). Bayesian Networks and Probabilistic Inference in Forensic Science. Chichester, Wiley. |
||||||||||||||
|
|
||||||||||||||
|
| ||||||||||||||