Indica un intervallo di date:
  • Dal Al
tecnologia

Coronavirus, contagiati, tamponi e ricoveri, regione per regione. Più qualità dei dati con il contributo dei civic hacker

Il grafico è elaborato sulla base dei dati resi disponibili da Davide Magno. Nella parte alta è possibile vedere l’andamento dei principali parametri relativi sia ai contagiati che ai tamponi effettuati, complessivamente e per regione. Nella parte sottostante si possono comparare le regioni sulla base di ogni indicatore. Quelle con valori uguali a zero non sono riportate nel grafico.

Anche i data scientist stanno facendo la loro parte nella lotta al dilagare dell’epidemia di Coronavirus. In questi giorni l’elaborazione di informazioni quantitative “dal basso” sta permettendo di avere accesso a nuovi dati e migliorare l’informazione di qualità sulla diffusione di Covid-19 in Italia. E’ un importante contributo per cercare di mostrare il fenomeno nella sua effettiva dimensione, attuale e prospettica.

Niente che gli infettivologi non sappiano già o non riescano a monitorare, ma i comuni cittadini hanno bisogno di avere i dati in forma semplice, interpretati rigorosamente ma comunicati in modo comprensibile.

Il Sole 24 Ore, ad esempio, da alcuni giorni ha reso disponibili mappe e grafici per orientarsi in modo visuale tra l’espandersi del virus nel nostro Paese.

La sfida di rendere esplicito ciò che è implicito

Come già evidenziato in questo post precedente, una delle enormi difficoltà che incontra chi in questi giorni voglia fare informazione seria e basata su evidenze concrete è la disponibilità di dati strutturati affidabili. La comunicazione tra chi ha responsabilità di gestione dell’emergenza e i cittadini quasi sempre avviene attraverso testi e tabelle diffuse in formato pdf. Che sono chiarissimi, se letti, ma inutilizzabili senza grande lavoro di post produzione – con tutti i rischi di errore umano connessi – per chi voglia fare analisi e fornire spunti di interpretazione originali. A questo punto però intervengono i “civic hacker”, ossia persone che mettono a disposizione della comunità le loro competenze di programmazione e analisi  per studiare come migliorare l’ambiente, la società o l’economia.

Tra questi c’è Davide Magno, 36 anni, brindisino di nascita ma expat a Dublino. Da più di 15 anni si occupa di applicazione di tecniche di data analysis e data engineering nel settore della gestione dei rischi finanziari per importanti gruppi internazionali. Grazie alle sue competenze di programmazione e di statistica ha scritto con il software R (un potente programma di analisi quantitativa molto usato sia in ambito accademico che professionale) un codice che importa i valori ufficiali sui casi di Coronavirus in Italia comunicati della Protezione civile, ne estrae l’informazione numerica e infine esporta il tutto in un formato aperto che chiunque può successivamente riutilizzare, come abbiamo fatto noi di Info Data.

Forniti con licenza CC0 (cioè utilizzabili da tutti, per qualsiasi scopo senza neppure dovere di citazione) ognuno può scaricarli liberamente alla pagina di Davide su Github, il sito che raccoglie codice software dai programmatori di tutti il mondo i quali rendono disponibile alla comunità il loro lavoro o cercano di migliorare quello altrui.