Scenari > Numeri > Quando i numeri ingannano
 
  
        
   
 
 
Sulla gestione dell'incertezza clinica
di Vittorio Girotto e Michel Gonzalez
 
 
 
Le persone non esperte di calcolo probabilistico sono in grado di formulare giudizi corretti di probabilità a posteriori? Le numerose ricerche sperimentali dedicate a questo quesito hanno dimostrato i limiti del ragionamento probabilistico dei non esperti. In particolare, è stata dimostrata la loro incapacità di risolvere problemi che riproducono, in forma schematica, una pratica frequente nell’attività clinica, cioè la valutazione del valore predittivo di un test strumentale (per rassegne in italiano, si veda Motterlini & Crupi, 2005; Crupi et al., 2006; Girotto, in stampa). Si tratta di compiti in cui si chiede ai partecipanti di stimare la probabilità che un individuo abbia effettivamente contratto una data malattia, qualora risulti positivo ad un test che serve a diagnosticarla. Le informazioni fornite per operare la valutazione probabilistica sono, in genere, l’incidenza della malattia nella popolazione e i valori di sensibilità e specificità del test. Lo scopo di queste ricerche non è solo teorico, ma anche pratico. Per molti psicologi, infatti, la possibilità di semplificare questi problemi significa offrire un contributo al miglioramento della comunicazione medico-paziente. Di conseguenza, sono particolarmente importanti le considerazioni di Davide Luciani (2006) sui limiti e le reali implicazioni cliniche dei risultati della ricerca psicologica, precedentemente presentati su Res Cogitans (v. Girotto, 2004).
Secondo Luciani, le difficoltà incontrate dalla maggioranza delle persone (medici compresi) nella risoluzione dei problemi di ragionamento clinico non dipendono dal “concetto di probabilità in sé”. Su questo punto non si può che esser d’accordo con la sua analisi. Esistono infatti numerose prove che anche persone completamente prive di conoscenze esperte, come i bambini piccoli, sono in grado di risolvere problemi elementari di probabilità (per una rassegna, v. Girotto & Gonzalez, in stampa). In altre parole, esistono numerosi dati ed argomenti per rifiutare l’ipotesi evoluzionista-frequenstista (v. Gigerenzer, 2003), secondo cui la mente umana sarebbe intrinsecamente incapace di trattare la probabilità di casi singoli e sarebbe, invece, in grado di elaborare informazioni relative a frequenze naturali.
Una volta stabilito che il ragionamento clinico è vincolato da vari fattori cognitivi (come il tipo di rappresentazione mentale attivata dai problemi o il tipo di calcolo numerico necessario per arrivare ad una conclusione), quali sono le possibili strategie per migliorarlo? Secondo Luciani, le soluzioni attualmente proposte presentano un grosso limite, cioè eliminano dai problemi di ragionamento clinico alcune informazioni essenziali per la pratica diagnostica reale. In particolare, l’uso di numeri interi al posto delle percentuali permette anche alle persone non esperte di formulare un giudizio corretto, ma tale giudizio ha un valore assai limitato, visto che non può andar oltre una specifica popolazione di riferimento. Per usare l’esempio discusso da Luciani, se spieghiamo che in un campione di 100 persone ci sono 4 malati e che 3 di questi, come pure 12 tra gli individui sani, hanno avuto una reazione positiva al test, permetteremo alla maggioranza delle persone di trarre un’inferenza corretta, cioè “In un nuovo gruppo di 100 persone, ci saranno 15 individui con una reazione positiva e 3 di questi saranno realmente malati” (v. ad esempio, Gigerenzer, 2003; Hoffrage & Gigerenzer, 1998). Tuttavia, non permetteremo loro di simulare ciò che di solito si fa nella pratica clinica, cioè valutare pazienti appartenenti a popolazioni diverse (nel caso in questione, pazienti appartenenti a popolazioni diverse da quella in cui sono stati registrati esattamente 4 casi di malattia su 100 individui). Insomma, si possono eliminare i valori della sensibilità e della specificità del test (rispettivamente, 75% e 12,5%), e sostituirli con i valori delle frequenze effettivamente osservate in un campione (rispettivamente, 3 su 4 e 12 su 96), oppure con i valori di probabilità espressi sotto forma di possibilità (Girotto & Gonzalez, 2001). In entrambi i casi, si otterrà un miglioramento molto parziale del ragionamento clinico, visto che entrambi i casi comportano l’eliminazione delle informazioni essenziali veicolate dai dati sulle caratteristiche del test.
Ora, ci sembra che questo rilievo critico non sia del tutto corretto. Ci sembra, infatti, che la possibilità di fare inferenze su popolazioni diverse dipenda dal modello della malattia e dalla sua relazione con i risultati del test. Supponiamo che la malattia investigata sia rappresentata come una variabile graduata (i cui vari livelli rappresentano il suo grado di gravità). Supponiamo poi che in una popolazione a rischio elevato tale malattia si presenti più spesso in forma acuta, e che si presenti più spesso in forma meno acuta in una popolazione a rischio meno elevato. Supponiamo infine che i risultati del test dipendano dalla gravità della malattia. Per esempio, se la forma è acuta, il test è sempre positivo; se la forma è meno acuta, il test è positivo una volta su due. In questo caso, i valori del test dipenderanno dalla popolazione considerata, dato che risulteranno più alti nella popolazione ad alto rischio che in quella a basso rischio. Supponiamo invece che il modello della malattia la rappresenti come una semplice variabile binaria (malattia presente vs. assente). In tal caso, contrariamente al primo, sarà possibile usare i valori del test rilevati in una data popolazione anche in altre popolazioni. Per esempio, se è stato osservato che in un campione di 100 persone ci sono 4 persone malate, 3 delle quali risultano positive al test, si potrà usare l’informazione “3 su 4” anche in riferimento ad altri campioni. Per esempio, la si potrà usare anche in riferimento ad un nuovo campione di 100 persone, 5 (o 10 o 20) delle quali risultano malate. Queste 5 (o 10 o 20) persone, infatti, sono malate esattamente quanto le 4 persone malate del primo campione e la probabilità che abbiano una reazione positiva al test è uguale a quella delle 4 persone malate del primo campione. Insomma, se la malattia è rappresentata come una variabile dicotomica, sarà possibile usare la frequenza “3 su 4” come una stima della sensibilità del test, qualsiasi sia la popolazione di riferimento.
Considerazioni analoghe valgono anche per i problemi in cui le probabilità sono espresse sotto forma di numeri di possibilità (o chances). Se la malattia può esser considerata come una semplice variabile binaria e i numeri di possibilità si riferiscono a una persona non specificata (cioè non a Paolo, ma a qualsiasi individuo), allora si potrà usare l’informazione “le possibilità che un malato abbia una reazione positiva sono 3 su 4” come una stima del valore della sensibilità del test, applicandolo a qualsiasi popolazione. In questo caso, infatti, 3 non corrisponde all’osservazione di 3 individui positivi sui 4 malati rilevati in un campione di 100, ma alle possibilità che qualsiasi persona malata possa avere una reazione positiva. Insomma, le informazioni sui numeri di possibilità, che si differenziano dalle informazione sulle frequenze (v. Girotto & Gonzalez, 2002), permettono di semplificare i problemi e non comportano necessariamente l’eliminazione dei dati relativi all’affidabilità del test.
In conclusione, le strategie proposte per migliorare il ragionamento clinico possono essere parziali e limitate. Esse però, possono rivelarsi utili nella comunicazione medico-paziente. Ci sono casi, ricordati da Luciani, in cui la stima conclusiva può esser di difficile comprensione per il paziente che, per esempio, potrebbe non conoscere l’affidabilità del test. In tali casi, non sembra molto utile usare le informazioni sulle frequenze. I problemi in cui i valori numerici da elaborare sono frequenze naturali non chiedono di stimare probabilità, ma di predire frequenze. In altre parole, non pongono domande come quella indicata nella Tabella 1 da Luciani, cioè:

Immagina che Paolo venga sottoposto al test. Se ha una reazione positiva, qual è la probabilità che abbia contratto la malattia?

Tale domanda, infatti, richiederebbe un giudizio che, secondo i sostenitori dell’ipotesi evoluzionista-frequenstista, le persone non sono in grado di formulare, cioè stimare la probabilità di un evento unico (in questo caso, la probabilità della malattia di uno specifico individuo). I problemi di frequenza, invece, pongono domande come la seguente:

Immagina che il test sia somministrato ad un nuovo gruppo di 100 persone. Tra quelle che hanno una reazione positiva, quante avranno realmente la malattia? ___ su ___.

Ora, che utilità potrebbe avere una simile inferenza nella pratica clinica reale? Non molto elevata, ci sembra. Se lo scopo del medico e del suo paziente è stimare la probabilità che una reazione positiva al test sia effettivamente accompagnata dalla presenza della malattia, allora non sarà di grande aiuto sapere quanti prossimi casi di individui realmente malati si incontreranno tra quelli che risulteranno positivi al test. Insomma, se si segue l’ipotesi frequentista e si trasformano i problemi di probabilità in problemi di frequenza, si perde la possibilità di fare stime di probabilità su casi singoli, cioè proprio le stime che, in genere, servono ai pazienti.
Nei casi ricordati da Luciani, una strategia da applicare dovrebbe essere quella che ha dimostrato di produrre il più alto tasso di stime corrette di probabilità, cioè quella che consiste nel chiedere un semplice giudizio comparativo (v. Girotto & Gonzalez, 2001). Se l’informazione è espressa in forma di numeri di possibilità, la soluzione è immediata, visto che le due congiunzioni rilevanti (“esser malato e positivo” vs. “esser sano e positivo”), sono automaticamente fornite. Di conseguenza, sarà semplice stabilire quale delle due ipotesi è più probabile. Per esempio, se il paziente sa che ci sono 3 possibilità che sia malato e positivo e 12 che sia sano e positivo, non gli sarà difficile concludere che è più probabile che sia sano, anche se ha avuto una reazione positiva al test. Ma anche se l’informazione è espressa in forma di percentuale, non è molto difficile portare il paziente a trarre un’inferenza comparativa corretta. Per farlo, il medico deve semplicemente ponderare i dati sull’affidabilità del test per la probabilità di base (75% x 4% e 12,5% x 96%) e fornire al paziente i valori delle due congiunzioni rilevanti. Se il paziente sa che ha il 3% di probabilità di esser malato e positivo e il 12% di probabilità di esser sano e positivo, non gli sarà difficile concludere che è più probabile che sia sano, anche se ha avuto una reazione positiva al test. In tal modo, il medico non avrà fornito al paziente una stima precisa della probabilità (che è uguale a 20%) di aver contratto la malattia, se è risultato positivo al test. Tuttavia, gli avrà permesso di capire l’essenziale, cioè che ha molte più possibilità di esser sano che malato. Se lo scopo principale del medico è quello di fornire informazioni rilevanti per le decisioni che i pazienti dovranno prendere, allora strategie di questa natura potrebbero rivelarsi un utile strumento per migliorare la comunicazione medico-paziente.


Vittorio Girotto (vittorio.girotto@iuav.it)
Università IUAV di Venezia, Convento delle Terese,
30123 Venezia
Michel Gonzalez (michel.gonzalez@up.univ-mrs.fr)
Laboratoire de Psychologie Cognitive,
University of Provence & CNRS, Place Victor Hugo
13331 Marseille (France)


Bibliografia

Crupi, V., Motterlini, M., & Gensini, G.F. (2006). La dimensione cognitiva dell’errore in medicina. Milano, Franco Angeli.
Gigerenzer, G. (2003). Quando i numeri ingannano. Milano, Cortina.
Girotto V. (2004). Il ragionamento probabilistico ingenuo. Res Cogitans, 18 novembre.
Girotto, V. (in stampa). Giudizio e ragionamento clinico. In C. Cacciari & C. Papagno (a cura di) Psicologia generale. Un manuale per le professioni medico-sanitarie. Bologna, Il Mulino.
Girotto, V. & Gonzalez, M. (2001). Solving probabilistic and statistical problems. Cognition, 78, 247-276
Girotto, V. & Gonzalez, M. (2002). Chances and frequencies in probabilistic reasoning. Cognition, 84, 353-359.
Girotto, V. & Gonzalez, M. (in corso di stampa). Norms and intuitions in the assessment of chance. In L. Smith, & J. Vonèche (a cura di) Norms and development. Cambridge, Cambridge University Press
Hoffrage, U., & Gigerenzer, G. (1998). Using natural frequencies to improve diagnostic inferences. Academic Medicine, 73, 538-540.
Luciani, D. (2006). Gestire l’incertezza clinica. Res Cogitans, 4 febbraio.
M. Motterlini & Crupi, V. (2005). Decisioni mediche. Un punto di vista cognitivo. Milano, Cortina.