"In God we trust, all others must bring data" (W.E. Deming).Actually, we should only trust data

di Tommaso Sartori

Vorrei iniziare con una confessione: le mie intenzioni, quando mi hanno proposto di scrivere questo articolo, erano assai diverse. Abituato a lavorare sui dati, speravo di individuare chi, in Italia, si occupa professionalmente di arte contemporanea, e di poter misurare gli effetti della pandemia sul loro salario e status occupazionale. Ciò non è fattibile, in breve, poiché è impossibile individuarli all’interno di un campione rappresentativo della popolazione nazionale, probabilmente per la natura eterogenea del gruppo in questione, che ne impedisce l’inserimento in una stessa categoria settoriale.
Andati in fumo i miei piani iniziali, ho pensato che potrebbe essere interessante unire il vuoto davanti al quale mi sono trovato al tema cardine della mostra, cioè la resistenza culturale. Mi piacerebbe declinare questo connubio perché la mia sensazione è che, nonostante il crescente afflusso di dati nelle nostre vite, siamo inesorabilmente incapaci di interpretarli (o di delegare questo lavoro a persone che lo facciano in maniera competente). La mancanza stessa dei dati utili all’analisi è emblematica. Sembriamo essere allergici al loro utilizzo, considerare la matematica non come un linguaggio universale ed essenziale per comprendere il mondo, ma piuttosto come tedioso, meccanico ed inutile utilizzo di formule, il più delle volte da memorizzare ed applicare senza alcuna riflessione.
Premetto che, da qui in avanti, userò categorie e classificazioni semplicistiche, della cui esistenza non sono particolarmente convinto. Penso però sia il modo più semplice per veicolare il messaggio che vorrei esprimere. D’altra parte, qualunque scelta dell’unità d’analisi, è in parte arbitraria. Questa lo è molto. Preciso che farò riferimento unicamente al contesto italiano, e che la mia definizione di dati è estremamente generale: in qualche modo, tutto si declina in maniera quantitativa.
Nell’immaginario collettivo (banalizzazione in arrivo, ma vi avevo avvertiti!), o almeno, in quello che io percepisco come tale, l’intellettuale non è donna o uomo di scienza, ma un umanista. Quest’ultimo rappresenta la persona colta ed istruita, capace di ragionare sul mondo e sulla società. Lo scienziato, invece, è molto più assimilabile ad un tecnico, che si limita ad osservare la natura. Ecco, trovo che quest’idea sia sbagliata, ed offensiva: in primis, per il cosiddetto umanista. Uno dei concetti logici basilari è la differenza fra un argomento valido ed uno corretto: sostanzialmente, la validità è indipendente dalla veridicità delle ipotesi fatte. Quest’ultima, inevitabilmente, rimane opinabile. Ed è per questo che, tutti noi, abbiamo bisogno di dati. Perché sono l’unico modo per elaborare delle assunzioni il più possibile realistiche, indipendenti dal contesto in cui ci troviamo, e dai bias che tutti noi abbiamo. Se l’umanista non sfruttasse la freddezza dei dati, rimarrebbe confinato alle sue impressioni: ogni suo pensiero, e la sua stessa concezione del mondo, risulterebbe provinciale ed autoreferenziale. Non che si riesca mai ad essere immuni da questo pericolo. Come insegna lo studio di Dunning e Kruger, la conoscenza diminuisce solamente la probabilità di sbagliare, ma non la elimina assolutamente.
A tal proposito, uno dei miei esempi preferiti riguarda la risoluzione di questo simpatico problema di probabilità, assegnato a degli studenti di medicina. Immaginate che il medico di famiglia vi comunichi la positività al test che individua una rara malattia neurologica degenerativa, che colpisce una persona su 1000: questo test individua chiunque abbia la malattia (zero falsi negativi), ma può risultare positivo anche per 5 individui sani su 100 (tasso di falsi positivi del 5%). Vi comunicherà che non avete nulla di cui preoccuparvi. Vi sentite rassicurati? La probabilità di avere la malattia in seguito ad un test positivo vi sembra alta o bassa? Siete convinti sia l’inizio della fine? Se stavate già pensavano a come spendere gli ultimi mesi di vita, tranquilli, siete in buona compagnia: più di ¾ degli intervistati ha risposto che la probabilità di essere malati fosse attorno al 95%. Per inciso, quella corretta è vicina al 2%. Se dei medici, di fatto alcuni degli individui più istruiti all’interno della popolazione, hanno difficoltà a gestire numeri così semplici, come possiamo pensare che gli altri ne siano capaci?
Trovo che sia diffusa una vera e propria resistenza culturale all’analisi quantitativa; ed anche quando viene affrontata, spesso, pecca di estrema superficialità. Guardiamo alla comunicazione dei dati portata avanti durante la pandemia: variazioni calcolate fra un giorno e l’altro invece che settimanalmente; continue contraddizioni nei messaggi mandati al paese, a volte per non ammettere che la risposta non è chiara (quantomeno, non ancora). La stessa gestione dell’emergenza è rimasta per la maggior parte del tempo data-inspired, ossia fondata su politiche restrittive successive alla variazione dei contagi. Un approccio data-driven, che prevede la selezione di alcuni indicatori specifici, relative soglie e misure stabilite a priori nel momento in cui questi limiti venissero superati, non è mai stato realmente utilizzato. No, le regioni colorate non contano: le restrizioni dipendevano da ragioni puramente politiche e circostanziali, non dai parametri osservati (peraltro ignoti), né dalle soglie, che venivano continuamente aggiustate.
È peraltro ironico, dal mio punto di vista, scrivere qualcosa basato su impressioni personali ed evidenza perlopiù aneddotica, piuttosto che su un’analisi quantitativa. Spero, in ogni caso, di non apparire come un predicatore: non è né la mia intenzione, né la mia indole. Non dispenso massime sulla vita (non sono decisamente la persona indicata), ma cerco di descrivere quello che vedo intorno a me: senza dati a disposizione, la mia capacità di farlo è estremamente limitata.
In ogni caso, non so quali potrebbero essere le ragioni di questo disamore (testimoniato, tanto per inserire almeno una statistica, dalla più bassa frazione di laureati in materie scientifiche sulla popolazione totale di ogni paese industrializzato, 9 su 200): difficile indagare un fenomeno così complesso senza scadere nella banalità e nei propri pregiudizi. Perché senza dati siamo destinati ad approcciarci alla realtà utilizzando categorie d’analisi inadeguate, ed in maniera puramente ideologica.

Riferimenti

R.A BURTON, Our world outsmarts US, Aeon.com, 2017;
D. DUNNING, K. JUSTIN, Unskilled and unaware of it: how difficulties in recognizing one’s own incompetence lead to inflated self-assessments, Journal of Personality and Social Psychology, 77(6): 1121-34., 1999;
OECD, Education at a Glance 2020: OECD Indicators, OECD Publishing, Paris, 2020;
G. RESTALL, Logic: an Introduction, Routledge, 2005.