Dall’inizio della pandemia molte voci si sono levate per chiedere l’accesso a dati dettagliati e tempestivi per monitorare la diffusione del Covid-19 e capire l’efficacia delle varie misure di contenimento messe in atto da governo e amministrazioni locali. Tuttavia, a distanza di oltre un anno, questi dati non sono ancora pienamente disponibili a ricercatori e studiosi.

L’Istituto Superiore di Sanità (Iss) dichiara che i dati sono accessibili alla comunità scientifica, ma le procedure di accesso sono tutt’altro che trasparenti e lasciano ampia discrezionalità all’Iss.

Inoltre, lo scorso novembre — prima di predisporre questo canale di accesso— l’Iss ha siglato un accordo per la condivisione dei microdati sia con l’Accademia dei Lincei che con l’Istituto Nazionale di Fisica Nucleare (Infn).

Il bilancio disastroso

A cinque mesi da quell’accordo, in un’intervista pubblicata su Fanpage lo scorso 8 Aprile, Giorgio Parisi, presidente dell’Accademia dei Lincei, dichiara che all’Accademia stanno «studiando il database, e [poichè] si tratta di un gigabyte di materiale, [stanno] scrivendo dei programmi per leggere questi dati».

A leggere queste parole non si può che rimanere sbalorditi ed è difficile trattenere un sorriso, che però cede il passo ad amarezza e sconforto.

Il database che l’Iss trasferisce settimanalmente ai Lincei «contiene circa 3 milioni e mezzo di righe, i dati di tutti i pazienti che sono stati registrati come malati di Covid». Forse queste parole vogliono sortire l’effetto si lasciare chi legge senza parole. In realtà, rivelano quanto poco lungimirante sia stata la scelta (presa da chi? E secondo quali creteri?) di affidare l’elaborazione e l’analisi dei dati all’Accademia dei Lincei.

Un dataset con poco più di 3 milioni di osservazioni non ha nulla di straordinario. Economisti applicati, per citare un ambito che conosco, lavorano quotidianamente con dataset di dimensioni ben maggiori in molteplici ambiti, dal mercato del lavoro a quello del credito, solo per fare alcuni esempi.

Non si tratta nemmeno di avere accesso a chissà quali tecnologie. Un buon laptop e, al massimo, l’accesso a un server, sono più che sufficienti per la maggior parte delle analisi.

Con calma, mi raccomando

Ciò che più sorprende è il seguito dell’intervista, quando Giorgio Parisi dichiara che l’Accademia sta lavorando con l’Infn per sviluppare «un sito Internet in cui, su richiesta, potremmo fornire alla comunità scientifica dei dati aggregati estratti da quel grosso database. Anche perché i dati disaggregati sono difficili da utilizzare per un'analisi. Il database in sé è utile solo come sorgente di dati aggregati».

Leggendo queste parole la prima domanda che sorge spontanea è come sia possibile che in oltre cinque mesi questa piattaforma non sia ancora stata messa a punto e resa disponibile al pubblico. Dati e analisi servono ora, in tempo reale. Non averli avuti negli scorsi mesi ha comportato costi in termini di minori informazioni per gestire la pandemia e averli tra qualche mese sarà, speriamo, inutile.

Ma la questione principale è un’altra.

Dichiarare che i dati disaggregati sono difficili da utilizzare e sono utili sono a generare statistiche aggregate significa sostenere esattamente l’opposto di ciò che afferma la comunità scientifica.

 Le statistiche aggregate sono largamente insufficienti a studiare l’evoluzione della pandemia e gli effetti delle policy. Esistono ormai molti studi—alcuni discussi anche su queste pagine—che mostrano le potenzialità dei dati disaggregati per capire come meglio contrastare la crisi sanitaria. Che chi ha accesso a questi dati non ne sia (o finga di non esserne) a conoscenza desta preoccupazione.

Con un accesso libero ai dati la comunità scientifica avrebbe potuto produrre analisi e studi in grado di informare governo e amministratori locali sulle possibili conseguenze e rischi delle diverse strategie di lockdown, dall’apertura delle scuole (un tema studiato ad esempio anche grazie ai dati Iss relativi alla Sicilia) a quello degli esercizi commerciali, su cui a distanza di mesi non c’è ancora un consenso.

Invece, nonostante l’accesso ai dati, nella sezione del sito dei Lincei dedicata al Covid-19, non si trovano documenti, dichiarazioni o pareri (nè tantomeno articoli scientifici) della “commIssione lincea Covid-19” nel corso del 2021. Affidare in maniera quasi esclusiva dati fondamentali in un momento così drammatico a un gruppo di accademici, molti dei quali non più attivi nella ricerca da anni, si è rivelata l’ennesima occasione sprecata.

© Riproduzione riservata