![]() |
Scenari > Numeri > Quando i numeri ingannano | |||||||||||||||
|
||||||||||||||||
|
![]() |
|||||||||||||||
Con l'avvento della modernità e l'applicazione di un approccio scientifico a problemi sempre più comuni della vita reale, assistiamo a un crescente ricorso a misure quantitative precise, e alla predominanza del loro ruolo per stabilire quali decisioni, pubbliche o private, meritino consenso e approvazione. La probabilità, ad esempio, entra in gioco tutte le volte che si desidera tenere conto non solo di certe eventualità, ma anche del loro rischio. D'altra parte, la precisione delle misure non è di per sé garanzia di un loro corretto utilizzo. Se limitiamo la nostra attenzione alle decisioni cliniche, che nella pratica medica corrente sono condizionate dalle misure di incertezza, sicuramente non mancano testimonianze su quanto risulti problematica la loro interpretazione, non solo nell'ambito della comunicazione fra medico e paziente (Epstein RM et al., 2004; La Pean A et al., 2005; Thomson R et al., 2005), ma, cosa forse più sorprendente, anche in quello tra medico e ricercatore (Colditz GA et al., 1985; Lyman GH et al., 1994; Weiss ST et al., 1980). Essendo quest'ultimo un contesto di professionisti, è naturale chiedersi da dove nascano tali difficoltà, se non altro al fine di proporre una formazione più adeguata al compito clinico. Quando il medico consulta i dati della letteratura, o ricorre alla loro memoria, il primo ostacolo che deve superare consiste nel rintracciare i dati rilevanti per il paziente che ha preso in esame. Sebbene possa contare su vasti archivi di descrizioni di singoli casi, non esistono tante descrizioni pubblicate per ogni possibile paziente. Di conseguenza, i dati studiati non saranno quelli prodotti dai suoi colleghi, ma quelli ottenuti dai ricercatori, lo scopo dei quali è indagare sulle possibili spiegazioni generali delle manifestazioni cliniche, nel tentativo di definire i criteri più adeguati al trattamento. Questo tipo di conoscenze è riferito ad eventi astratti (mentre agli esordi della medicina si studiavano i 'malati', e non le 'malattie' - Ackerknecht EH, 1955), e risulta perciò di una qualche utilità pratica solo se elaborato nell’ambito di una teoria capace di collegarli alle manifestazioni identificate nei pazienti in esame. Alla luce di queste considerazioni, l'indagine clinica sarà guidata dalle ipotesi che il medico ritiene più suggestive, e non rifletterà in alcun modo l'applicazione di una procedura automatica (Burton PR, 1994; Haynes RB et al., 1980; Kaptchuk TJ, 2003). Se è vero che la validità della medicina andrebbe sempre ricondotta alla sua base empirica, è la teoria a permettere al medico di trattare, con poche conoscenze generali, molti casi particolari. Non è possibile assumere che le caratteristiche dei nuovi casi rientrino esattamente nei quadri clinici studiati precedentemente, mentre una conoscenza medica puramente descrittiva comporterebbe una tale ridondanza, da rendere ancora più sterminata la quantità di informazioni cui il medico dovrebbe avere accesso, senza che questo garantisca la disponibilità di una quantità maggiore di dati rilevanti. Del resto, l'organizzazione causale delle teorie mediche risulta evidente a partire dalla struttura dei testi universitari, dove un numero praticamente illimitato di combinazioni di sintomi, segni e dati strumentali viene ricondotto a un numero relativamente esiguo di patologie. Anche il problema citato da G. Gigerenzer sull’interpretazione dell’esito di un test diagnostico può essere considerato di questo tipo (Gigerenzer G, 2003). Nell'esempio riportato, a partire da conoscenze generali quali la sensibilità e la specificità di un test verso una malattia, si cerca di stabilire la probabilità di malattia di un soggetto positivo al test, previa disponibilità della probabilità della malattia nella popolazione cui quel caso appartiene. Lo stesso autore sottolinea l’artificiosità di un simile approccio, in quanto la soluzione dipende dall'elaborazione di stime probabilistiche indirette, e non dalla misura di quanti sono i pazienti malati fra quelli sottoposti al test e positivi. Perché mai i ricercatori non si preoccupano di fornire ai clinici le informazioni che poi comunicheranno ai pazienti? La risposta dipende dal fatto che certe stime sono più stabili di altre. Nonostante la correttezza di questa assunzione vada verificata caso per caso, (Ransohoff DF et al., 1978), le caratteristiche biologiche, che spiegano la positività e la negatività di un test in presenza o meno di malattia, sono di gran lunga più stabili delle caratteristiche epidemiologiche, che coincidono con la proporzione di malati in una determinata popolazione. Se non si tenesse conto di questo aspetto, i dati prodotti dalla ricerca potrebbero invecchiare così rapidamente da risultare inadeguati a prendere qualunque decisione clinica. Di solito, si è portati ad accettare qualche complicazione di calcolo in più, se con questo si offre l'opportunità di generalizzare i risultati giù ottenuti risparmiando nuove indagini scientifiche. A questo punto, solleverei il dubbio che all'origine delle complicazioni interpretative denunciate in più occasioni, non vi sia il concetto di probabilità in sé, ma la teoria scientifica che dovrebbe guidare il ragionamento per l'applicazione della probabilità a casi concreti. Sono ovviamente molti i modi in cui una teoria può complicare l'uso delle misure dell’incertezza su un singolo caso. Il più ovvio, dipende dal numero di calcoli algebrici previsti per arrivare alla conclusione. Nell’esempio del test diagnostico, sia G. Gigerenzer che V. Girotto (Girotto V., 2004) propongono una formulazione più semplice di quella originale, ma tale semplicità non sembra affatto dipendere dal ricorso a frequenze (nel primo caso) o al numero di possibilità (secondo caso). Piuttosto, entrambi gli autori fanno implicitamente ricorso, almeno parzialmente, alla teoria che dovrebbe guidare la corretta soluzione del problema. Nella tabella sono riportate tre formulazioni alternative dello stesso quesito diagnostico. La prima rappresenta quella originale, la seconda e la terza sono quelle proposte rispettivamente da G. Gigerenzer e V. Girotto.
Utilizzando le frequenze, basta sommare il numero di soggetti positivi con malattia (3) e riferirlo al numero di soggetti con test positivo (3+12). V. Girotto dimostra invece che una concezione epistemica della probabilità può essere altrettanto comprensibile di una concezione frequentista. Nella sua formulazione, occorre riferire il numero di possibilità in cui un soggetto è positivo e con malattia (3) al numero di possibilità che prevedono la positività del test in caso di assenza di malattia (12). Con queste formulazioni tuttavia, si tende a dimenticare che il ricercatore, nel riportare ad esempio una sensibilità del test pari al 75%, intende proporne l'applicazione a qualsiasi popolazione, e non solo quando i pazienti malati sono 4 su 100. Soltanto quando si considera che il paziente preso in esame appartiene a una popolazione dove la prevalenza di malattia è di 4 su 100, il numero '3' assume una qualche importanza. Lo stesso vale per il numero '12' riferito ai 96 pazienti sani. Dal momento che in letteratura, proprio per lasciare il medico libero di applicare le caratteristiche del test alla proporzione di malattia della popolazione del suo paziente, compariranno solo stime di proporzioni, qualcuno dovrà comunque prendersi carico di moltiplicare 0,75 con 0,04 ottenendo 0,03, facendo altrettanto con le stime di 0,125 e 0,96, ottenendo 0,12. Se poi si preferisce trattare con numeri interi, non resta che moltiplicare per 100 i risultati di entrambi i prodotti. Tutti questi calcoli sono semplicemente impliciti nelle formulazioni alternative proposte nella tabella, ma restano necessari per una corretta attribuzione della classe di riferimento, nel tentativo di ricondurla alle caratteristiche di uno specifico individuo. Non sorprende perciò che la riduzione del numero di calcoli previsti dalla formula di Bayes renda più semplice la sua applicazione. Ci si potrebbe chiedere allora perché non ricorrere completamente alla teoria, producendo, per il paziente che lo richiede, la sua probabilità di malattia in funzione dell’esito del test a cui si è sottoposto. Esistono senza dubbio circostanze in cui una tale stima conclusiva potrebbe risultare controintuitiva per il paziente, vuoi perché non conosce il livello di affidabilità del test, o perché non è consapevole dell'effetto della diffusione della malattia indagata sulla valutazione del suo rischio personale. Di fronte a queste eventualità, rendere più esplicito il ragionamento clinico potrebbe facilitare la comprensione, e una applicazione predigerita della formula di Bayes come quelle proposte potrebbe rivelarsi una interessante opportunità di educazione sanitaria (Weed LL et al., 1999). Volgendo l'attenzione alle difficoltà del medico nei confronti dei dati della letteratura scientifica, ritengo invece che una tale facilitazione sarebbe solo apparente, perché dovrebbe potervi fare affidamento ogni volta che esamina un paziente diverso (Sox HC, 1986). A questo punto sarebbe meglio dotarlo di uno strumento di calcolo che gli consenta di inserire i dati di partenza e ottenere la soluzione finale corretta. Queste considerazioni mi portano a dubitare che, da un punto di vista evolutivo, l'uomo non si sia ancora adattato all'uso delle probabilità. O meglio, la probabilità a mio parere non comporterebbe dei problemi di comprensione specifici, ma le difficoltà tipiche di un qualunque dato scientifico che viene calato, più o meno forzatamente, nella quotidianità. A questo proposito, la storia abbonda di risultati controintuitivi, o che tali sono sembrati all'epoca della loro introduzione. Ma con questo, nessuno chiederebbe mai a un fisico nucleare di fare delle previsioni escludendo che possa ricorrere ai suoi modelli matematici o ai calcolatori. Semmai, nel caso della professione medica, il problema potrebbe nascere dall'apparente familiarità di nozioni quali salute e malattia, e dall'enfasi attribuita nell'ambito della formazione ospedaliera alle abilità tecnico-manuali, mentre le occasioni per esercitare il ragionamento clinico appaiono relativamente trascurate (Elstein AS et al., 2002). D'altra parte, il passaggio dal contesto sperimentale o di osservazione controllata, a quello della pratica clinica, richiede sempre il massimo rigore, proprio per poter decidere se, nel paziente esaminato, tutto quello che il disegno sperimentale non ha saputo o potuto rivelare sia o meno rilevante per la decisione. Nell'esempio riportato, il medico dovrebbe chiedersi se le caratteristiche del suo paziente, come l'età o le patologie associate, lo autorizzino a utilizzare le misure di sensibilità e specificità eventualmente stimate in pazienti di età diverse, o senza alcuna patologia associata. Nella peggiore delle eventualità, dovrà studiare il comportamento dello stesso test in una popolazione più simile al suo paziente. Dovrà inoltre chiedersi fino a che punto le caratteristiche di quest'ultimo influenzino la presenza o l'assenza della malattia, in modo da poter decidere se fare affidamento sui risultati dell'indagine epidemiologica nella popolazione generale (Harris JM, 1981). Una volta ricomposto il quadro delle spiegazioni causali del possibile esito del test, sarà in grado di decidere non solo quali siano le stime probabilistiche da utilizzare, ma anche come queste vadano combinate (Hernán MA et al., 2002). Pertanto, prima di occuparsi di come formulare la sintesi del risultato di una teoria (Kurzenhäuser S et al., 2002), il medico deve controllare se essa sia idonea all'analisi del caso su cui si intende applicarla. Nonostante i vincoli imposti dalla necessità di mediare con la volontà dei pazienti e con i più svariati contesti operativi rendano l'attività clinica particolarmente complessa, avvicinandola tuttora più a una arte che a una scienza, ciò non deve in alcun modo legittimare un uso distorto delle prove scientifiche nel tentativo di semplificarne l'interpretazione per adattarla al senso comune, sempre che si ammetta ancora, fra le responsabilità dei nostri medici, quella di agire consapevolmente sulla base delle conoscenze riconosciute come fondamenta della loro professione. Davide Luciani Unità di Ingegneria della Conoscenza Clinica, Laboratorio di Epidemiologia Clinica, Istituto Mario Negri, Bergamo Bibliografia Ackerknecht EH. A Short History of Medicine. The Ronald Press Co. NY, 1955 Burton PR. Helping doctors to draw appropriate inferences from the analysis of medical studies. Stat Med. 1994 Sep 15;13(17):1699-713. Colditz GA, Emerson JD. The statistical content of published medical research: some implications for biomedical education. Med Educ, 1985 May; 19(3):248-55 Elstein AS, Schwarz A. Evidence base of clinical diagnosis: Clinical problem solving and diagnostic decision making: selective review of the cognitive literature. BMJ, Mar 2002; 324:729-732 Epstein RM, Alper BS, Quill TE. Communicating evidence for participatory decision making. JAMA, 2004 May 19;291(19):2359-66 Gerd Gigerenzer, Quando i numeri ingannano, Raffaello Cortina editore, Milano, 2003 Girotto V. Il ragionamento probabilistico ingenuo, Res Cogitans, 18/11/2004. Harris JM. The hazards of bedside Bayes. JAMA. 1981 Dec 4;246(22):2602-5. Haynes RB, McKibbon KA, Fitzgerald D, Guyatt GH, Walker CJ, Sackett DL. How to keep up with the medical literature: I. Why try to keep up and how to get started. Ann Intern Med. 1986 Jul;105(1):149-53. Hernán MA, Hernández-Díaz S, Werler MM, Mitchell AA. Causal knowledge as a prerequisite for confounding evaluation: an application to birth defects epidemiology. American Journal of Epidemiology, 155:176-184, 2002. Kaptchuk TJ. Effect of interpretive bias on research evidence. BMJ, Jun 2003; 326: 1453 - 1455; Kurzenhäuser S, Hoffrage U. Teaching Bayesian reasoning: an evaluation of a classroom tutorial for medical students. Med Teach. 2002 Sep; 24(5):516-21 La Pean A, Farrell MH. Initially misleading communication of carrier results after newborn genetic screening. Pediatrics, 2005 Dec;116(6):1499-505 Lawrence LW, Lincoln W. Changing the doctor-patient relationship. Opening the black box of clinical judgment: an overview BMJ 1999; 319:1279 Lyman GH, Balducci L. The effect of changing disease risk on clinical reasoning. J Gen Intern Med. 1994 Sep;9(9):488-95. Ransohoff DF, Feinstein AR. Problems of spectrum and bias in evaluating the efficacy of diagnostic tests. New England Journal of Medicine, 299:926-930, 1978. Sox HC. Probability theory in the use of diagnostic tests. An introduction to critical study of the literature. Ann Intern Med. 1986 Jan;104(1):60-6. Thomson R, Edwards A, Grey J. Risk communication in the clinical consultation. Clin Med, 2005 Sep-Oct; 5(5):465-9 Weiss ST, Samet JM. An assessment of physician knowledge of epidemiology and biostatistics. J Med Educ. 1980 Aug;55(8):692-7. |
||||||||||||||||
|
||||||||||||||||
|