Indica un intervallo di date:
  • Dal Al
economia

Coronavirus, spieghiamo al Governo cosa sono i dati aperti. Un’altra volta

Aggiornati con la più alta frequenza possibile, leggibili da una macchina e con una licenza che ne consenta il riutilizzo da parte di chiunque. Potrebbe anche chiudersi qui, questo pezzo, dopo aver elencato le tre caratteristiche che dovrebbero avere i dati relativi ai 21 indicatori che determinano il colore delle regioni, ma più in generale tutte le informazioni relative alla pandemia da Sars-CoV-2.

E invece tocca farsi forza e ribadire un concetto che su queste colonne, ma non solo, viene ripetuto da mesi. Gutta cavat lapidem, chissà che non avessero ragione i latini. Proviamo solo a mettere ordine, stai a vedere che la colpa non sia della scarsa chiarezza con cui si sono chiesti dati aperti.

Intanto, i dati vanno pubblicati. E fin qui, più o meno, ci siamo. Nel senso che sappiamo, grazie alla Protezione civile, quanti sono i contagiati e i ricoverati su base regionale. Ma non sappiamo, ad esempio, quanti siano i ricoverati in terapia intensiva su base provinciale. Non sappiamo, a dire il vero, nemmeno il numero esatto dei posti letto a disposizione nei reparti di terapia intensiva. Nè, per venire a questioni più recenti, i dati sulla base dei quali vengono calcolati i 21 indicatori che stabiliscono quali misure di contenimento applicare alle diverse regioni.

Questi ultimi, invece, li conosciamo, perché vengono pubblicati. Ma, qui il secondo elemento problematico, sono presentati in .pdf. Ovvero il formato chiuso per eccellenza. Oppure con una dashboard, un grafico come quello realizzato da Agenas per dar conto della saturazione dei posti nelle terapie intensive. Per carità, strumenti utili. Ma non esaustivi. Appunto perché non consentono l’estrazione e il conseguente utilizzo dei dati sottesi.

Di positivo, però, i dati di Agenas hanno che sono aggiornati con frequenza quotidiana. Cosa che non avviene, invece, con i bollettini che l’Istituto superiore di Sanità dedica alla pandemia in Italia. Che vengono forniti, manco a dirlo in .pdf, una volta la settimana. Rischia di essere più corto il periodo di incubazione del Sars-CoV-2, per dire.

È finita? No, perché manca un ulteriore elemento. Perché anche una volta che i dati sono stati pubblicati in formati leggibili da un software (ovvero non in .pdf, ma in .csv, .odt o .xls per citarne alcuni) e sono aggiornati frequentemente, bisogna anche concedere il permesso di utilizzarli, questi dati.

Tocca insomma ribadire, ed è curioso doverlo fare ad un governo il cui principale azionista è un partito nato in Rete, che non tutto quello che si trova su Internet è ipso facto condivisibile e riutilizzabile. Per dire, i dati sui 21 indicatori, scaricabili in .pdf dal sito del Ministero della Salute, sono sotto la licenza CC BY-NC-ND 2.5 IT. Circostanza che tutela sì il diritto di cronaca, ma impedisce l’utilizzo di questi dati per realizzare opere derivate o a fini commerciali. Quindi un cittadino che volesse realizzare un’app che fornisca queste informazioni non potrebbe farlo.

Un elemento in più che ci porta a dire che i dati che vengono resi noti dal governo sulla pandemia sono tutto fuorché aperti. L’unico esempio davvero positivo riguarda la Protezione civile, il cui sforzo di trasparenza, però, non è più sufficiente, visto che si limita a comunicare contagi, tamponi, ricoveri e decessi.

Prima di chiudere, il lettore conceda due postille finali. Il ministero della Salute ha annunciato nei giorni scorsi un accordo tra l’Istituto superiore di Sanità e l’Accademia dei Lincei, alla quale saranno forniti tutti i dati in possesso dell’Iss per consentirle lo studio della pandemia in Italia. Ora, con tutto il rispetto per gli oltre 4 secoli di storia di questa istituzione, ma non si capisce perché escludere il resto della comunità scientifica italiana e mondiale. Oltretutto durante una pandemia che ha spinto il mondo della ricerca nella direzione dell’open science. Ovvero, per dirla con una brutale semplificazione, della condivisione dei dati.

Infodata, e qui davvero chiudiamo, ha promosso #datiBeneComune una petizione rivolta al presidente Giuseppe Conte affinché i dati relativi alla pandemia vengano resi disponibili con le caratteristiche descritte in questo pezzo. Una petizione che ha superato le 36mila firme. L’invito ai lettori che ne condividessero le ragioni e non lo avessero ancora fatto è quello di sottoscriverla.

Qui gli altri episodi della cronaca critica della diffusione dei dati:
S01E01
So1Eo2
S01E03
S01E04
S01E05
S02E01

S02E02
S02E03

Ultimi commenti
  • Francesca |

    Una domanda: ma il link con i dati in pdf che avete messo ha i dati aggiornati a fine ottobre o sbaglio? Così c’è scritto in piccolo sulla prima pagina. Dove sono quelli aggiornati?

  • claudio |

    Tanto per gradire: Fonte WHO di oggi- in Spagna complessivamente dall’inizio della pandemia ci sono stati 44.668 morti. In Italia (che ha gestito la pandemia in modo esemplare con mascherine da marzo) ci sono stati 54.904 in Francia che hanno fatto alcuni brevi lockdown e tenuto aperte le scuole e hanno 7 milioni di abitanti in più ci sono stati 51.965 morti. In Spagna nelle ultime ore ci sono stati ZERO morti e in Francia 198 contro i 541 dell’Italia. Si può tranquillamente dire che il modello italiano che ci invidiano tanto all’estero …è una grande fake-news!!!!

  • Franco |

    L’articolo chiede di pubblicare (e con licenza aperta) dati diversi da quelli che sono disponibili su github. Caro Luogi Puzone, credo debba rileggere quello che scrive l’autore di qiesto pezzo.

  • Michele Mezza |

    Il buco nero dei dari ,che rende insufficienti e ineseguiti gli indicatori selezionati dal governo riguarda il loro carattere del tutto di consuntivo,dunque di lenta fotografia di quanto è accaduto mentre ci spiegano gli esperti che una epidemia può essere circoscritta solo anticipando le dinamiche e la localizzazione dei focolai di incubazione cone solo integrando i dati inerti del CTS con quelli dinamici della rete,in particolare i sentimenti dei social,senza i quali ,come dice Crisanti ,non possiamo contestare il virus.Per questo mi pare singolare che si raccolgano firme e attenzioni per sollecitare la trasparenza di dati epidemiologici ,che devono essere pubblici,e che con la stessa forza non si reclami da Google e Facebook l’accesso a informazioni vitali per costruire grafi predittivi della pandemia .

  • Luigi Puzone |

    I dati in formato aperto relativi alla pandemia covid-19 sono qui:
    https://github.com/pcm-dpc/COVID-19
    Luigi P.

Suggeriti