Indica un intervallo di date:
  • Dal Al
cronaca

Sette giorni in zona rossa per un errore? La Regione Lombardia, le “colpe” dell’algoritmo e l’urgenza dei dati aperti

Ogni settimana la Regione invia i dati i relative ai positivi, guariti, decessi e pazienti in terapia intensiva all’Istituto superiore di sanità (Iss) per calcolare l’indice Rt (qui vi spieghiamo bene cosa misura) che indica il numero medio delle infezioni prodotte da ciascun individuo infetto. Questo indice concorre a definire i colori della mappa delle regioni, cioè quello che si può o non si può fare. Quando una regione ha un Rt superiore a 1,5 finisce tendenzialmente fra le “zone rosse”.  L'”algoritmo” che in realtà è una formula, viene calcolato dall’Iss sulla base dei dati forniti dalle regioni ogni settimana, da aprile non è mai cambiato ed è uguale per tutte le Regioni. Se ve lo volete studiare trovate i materiali qui e qui.

Come vengono compilati i dati? Ogni settimana viene inviato un foglio elettronico che contiene le informazioni relative ai pazienti positivi, i guariti, i decessi e chi è in terapia intensiva. Ogni volta che viene rilevato un caso clinico, viene compilato il relativo campo “stato clinico” nel quale viene indicato il grado di severità dei sintomi, da paucisintomatico a severo e, quando possibile, anche la data della loro insorgenza. Presenza di sintomi e data di insorgenza sono le due variabili che definiscono i soggetti da considerare per il calcolo di Rt.  Questo documento deve contenere informazioni epidemiologiche più dettagliate relative allo stato di sintomaticità. Per esempio, per decidere il colore di una regione conta quando si può uscire dall’isolamento. Il ministero ha deciso tra i 10 e i 21 giorni dalla comparsa dei sintomi. Se queste informazioni non ci sono, sono parziali  può accadere quello che è successo alla Lombardia.

I numeri prima e dopo la “revisione”. Proviamo a ricostruire quello che è successo partendo dalla rettifica dei dati inviati a Roma il 20 gennaio. Sulla base dei nuovi numeri,  sarebbero stati sovrastimati i casi di positivi sintomatici. Più nello specifico è diminuito il numero del “totale dei soggetti positivi con data inizio sintomi o assenza di informazione” (da 419.362 a 414.487) e sarebbe aumentato quello dei positivi “con data inizio sintomi dichiarato stato asintomatico o evidenza di guarigione/decesso senza indicazione di stato sintomatico precedente” (da 234.070 a 246.8549).  Conclusione? Con questa revisione  l’indice Rt è passa da 1,4 a un valore medio di 0,88. Tenendo conto degli altri 21 parametri scelti dal Governo vuole dire per la Lombardia passare da “rossa” ad “arancione”.

Non è chiaro come sia avvenuto l’errore ma è grave che non sia chiaro. Tanto che è in corso una braccio di ferro senza precedenti tra Regione e Ministero della Sanità sulla responsabilità dell’errore. Attilio Fontana, il presidente della Regione Lombardia e Letizia Moratti, il nuovo assessore al Welfare che ha preso il posto di Gallera hanno prima dato colpo all’algoritmo dell’Iss.

 

Dare la colpa all’algoritmo è un po’ come calciare forte la palla fuori dal campo.  Rischia di essere un precedente pericoloso non solo e non tanto per il ruolo che gli algoritmi stanno occupando nella società attuale e a tutti i livelli, si pensi alla polemica delle black box dell’intelligenza artificiale, ma anche perché non aiuta a comprendere i meccanismi decisionali. Gli algoritmi sono strumenti espressione di scelte e valori. Non possono essere responsabili neppure nel caso ci fossero dei bug informatici nel calcolo degli stessi.  Ma il conflitto ora è diventato istituzionale.

Secondo la Regione Lombardia  la sovrastima sarebbe dovuta a un’anomalia dell’algoritmo utilizzato dall’Istituto per l’estrazione dei dati per il calcolo dell’Rt, segnalata dagli uffici dell’assessorato al Welfare della Regione e condivisa con Roma.  In altre parole, la Lombardia non avrebbe mandato dati incompleti e neppure richiesto di rettifica, ma un “necessario aggiornamento di un ‘campo del tracciato’, tracciato che quotidianamente viene inviato all’Istituto Superiore di Sanità”.

La posizione della Regione Lombardia.  In una conferenza stampa sabato 23 gennaio Attilio Fontana ha dichiarato: “Se da domenica la Lombardia tornerà arancione lo deve esclusivamente al fatto che noi abbiamo contestato i conteggi del governo“: ha detto il presidente della Lombardia Attilio Fontana in un punto stampa in Regione con l’assessore al Welfare Letizia Moratti. “Sono indignato da quello che leggo e dalle false notizie offensive per la Lombardia e per le persone che ci lavorano“. Il ministro Speranza, che ha firmato la nuova ordinanza per mettere la Lombardia in zona arancione, “pretendeva che dicessimo che c’era stato un errore nostro. Ma non potevamo accettarlo per la dignità della Regione, per le nostre famiglie e le imprese“, ha spiegato l’assessore Letizia Moratti.

Per il ministero della Sanità invece la Regione Lombardia ha trasmesso dati errati, successivamente ha rettificato i dati propedeutici al calcolo del Rt e questo ha consentito una nuova classificazione.

La risposta dell’Iss.  Il 23 gennaio l’Istituto superiore di sanità ha precisatoche l’algoritmo è corretto e funziona in modo uguale per tutte le Regioni. Anzi, nel merito ha precisato: “La Lombardia, ha segnalato dall’inizio dell’epidemia nell’ultimo periodo, una grande quantità di casi, significativamente maggiore di quella osservata in altre regioni, con una data di inizio sintomi a cui non ha associato uno stato clinico e che pertanto si è continuato a considerare inizialmente sintomatici, in accordo con la procedura sopra descritta. Questa anomalia è stata segnalata più volte dall’ISS alla regione Lombardia“.

Domenica 24 gennaio sul quotidiano Repubblica il presidente dell’Iss e membro della Cabina di regia e del comitato tecnico scientifico Silvio Brusaferro ha aggiunto: “È stata Regione Lombardia  a contattarci per chiedere di fare approfondimenti su alcuni indicatori. Gli abbiamo dato alcune informazioni assieme alla Fondazione Kessler (la Fondazione Bruno Kessler che ha elaborato l’algoritmo con l’Istituto per il monitoraggio dell’epidemia ndr). La Regione il 20 ha poi caricato i suoi dati sul database dell’Istituto come ogni mercoledì“.

Secondo l’Iss la Lombardia dall’inizio dell’epidemia nell’ultimo periodo avrebbe segnalato una grande quantità di casi, significativamente maggiore di quella osservata in altre regioni, con una data di inizio sintomi a cui non ha associato uno stato clinico.  L’Iss li ha considerati in base alla procedura “inizalmente sintomtici”, da qui l’origine della sovrastima.

Questa anomalia, scrivono, è stata segnalata più volte dall’ISS alla regione Lombardia“. Quindi la qualità del dato sarebbe stata bassa da più di una settimana. E questo aggiunge ulteriore incertezza ai dati che vengono usati per decidere quello il colori della mappa e quindi, lo ribadiamo, quello che possono o non possono fare i cittadini.

La vicenda non è finita. E visto il prezzo pagato dalle attività commerciali che sono rimaste in zona rossa per una settimana potrebbe avere un conclusione nei tribunali con un accertamento delle responsabilità tra Stato e Regioni ed eventuale risarcimento.

La questione aperta anzi apertissima dei #datibenecomune. Se c’è stato un errore nella compilazione dei dati diffusi è difficile immaginare che ci sia un singolo “colpevole”, qualcuno che materialmente si è “sbagliato” a inserire un numero. Il sistema di tracciamento dei dati non solo in Lombardia non ha funzionato. Non c’è chiarezza sulle procedure di inserimento dati, sulle procedure di controllo di qualità del dato e, come direbbe un informatico, sul debugging cioè sui metodi per trovare i possibili errori nella compilazione dei dati. Da qui una domanda che è piuttosto ricorrente su questo blog:  cosa sarebbe successo se i dati della Lombardia fossero rilasciati in formato aperto. Se a controllare i dati epidemiologici (in forma disaggregata e nel rispetto della Gdpr) ci fossero stati gli occhi di decine di ricercatori, associazioni, cittadini per monitorare, controllare e aiutare? La risposta non  data. Non lo sappiamo perché i dati sono chiusi. Se vuoi firmare la petizione #datibenecomune,  promossa da Ondata, Transparency International Italia e decine di altre associazioni clicca qui.

Qui gli altri episodi della cronaca critica della diffusione dei dati:
S01E01 So1Eo2 S01E03 S01E04 S01E05 S02E01 S02E02 S02E03 S02E04