Una breve panoramica su alcuni strumenti utilizzati per monitorare la diffusione del Covid-19 mostra come la data science sia centrale in questo contesto e che il “nuovo petrolio”, costituito dai dati, sia da affrontare con ottica internazionale, rimuovendo confini così come il fenomeno che si intende combattere.
Una delle sfide attuali per contrastare la diffusione dell’epidemia e, soprattutto, di trovare la cura, è quella di mettere a disposizione, in modo aperto, i dati raccolti sulla pandemia, al fine di migliorare analisi e predizioni. È noto che il machine learning si nutre di dati. E che le speranza di una più rapida soluzione anche a problemi medici sia facilitata dalla loro disponibilità su vasta scala.
Il punto da discutere è la loro “strutturazione”. I dati raccolti, infatti, devono essere costruiti su sistemi decentrati e garantirne l’uso in stretta corrispondenza al necessario; a fini di ricerca, occorrerebbe garantirne l’apertura e, allo stesso tempo, non essere ricollegati a singoli individui, soggetti ad accessi o utilizzi abusivi. Devono, quindi, essere costruiti nel rispetto di standard elevati di sicurezza, se si vuole evitare che si perdano o finiscano nelle mani sbagliate.
La collaborazione nella raccolta e condivisione di dati, rispettando questi criteri, può rivelarsi fondamentale per le sfide future. Risposte concrete e, allo stesso tempo, lungimiranti, non si sono fatte attendere.
Il Coronavirus Tech Handbook, lanciato a Londra nel marzo scorso, “is a crowdsourced library of tools and resources relating to COVID-19 response. It is a rapidly evolving resource with thousands of expert contributors”. Raccoglie una mole consistente di informazioni sui progetti tecnici, messi a disposizione di progettisti e ricercatori. Lo spazio è dedicato anche ai “non technologist” e, dunque, alle organizzazioni civiche, nonché alle istituzioni pubbliche. è una idea di collaborazione aperta, nata come risposta all’emergenza sanitaria del 2020.
La SDSN TReNDS (Thematic Research Network on Data and Statistics, iniziativa della Sustainable Development Solutions Network delle Nazioni Unite) è una iniziativa che mira a valorizzare il quadro delle risorse a disposizione. “During this challenging time, data sharing and collaboration between academia, governments, civil society, and the private sector is critical to how we better monitor, understand, and help to mitigate this pandemic”. Lo sviluppo dei dati e della loro gestione è destinata a mutare, in ragione della complessità dell’ecosistema in costruzione. Ritardi, miopie e incompletezza costituiscono un freno a una risposta efficace e, per quanto possibile, rapida. Il punto toccato dall’iniziativa è che occorre dotare i decisori di esperti competenti in statistica, analisi dei dati, capacità calcolatrici e previsionali, unitamente agli specialisti del settore medico e virologico. Gli esperti dovrebbero essere provenienti dal mondo accademico, delle industrie e della società civile.
Esempio molto interessante è dato dalla “Contracts for Data Collaboration (C4DC)”, che analizza le condizioni giuridiche della collaborazione e dello scambio dei dati, sondandone la legittimità. Attraverso il parametro degli obiettivi stabilito, da quelli locali ai Sustainable Development Goals (SDGs), viene rilevata la scarsità della collaborazione e vengono applicati indicatori volti a indicare il grado di regolarità dello scambio (in un recente survey, sono state , specific to the SDGs, 131 dei 232 indicatori dei SDG ancora non avevano sufficienti dati a disposizione). L’iniziativa è, a sua volta, frutto della collaborazione di diversi soggetti (GovLab, la citata SDSN TReNDS, la University of Washington’s Information Risk Research Initiative, il World Economic Forum), anche al fine di creare una libreria online per condividere gli accordi che disciplinano lo scambio di dati (Data sharing agreements, DSA). L’ambito è esteso riguarda molte nazioni, con l’indicazioni di prassi, guide, spiegazione di casi specifici.
Il GovLAB, in un documento programmatico ha declinato sette principi per migliorare la raccolta dei dati, tra cui si segnalano lo sviluppo di una governance di sistema, in cui soggetti pubblici e privati possano dialogare su scala mondiale; la creazione di una rete dei soggetti coinvolti; l’individuazione, all’interno delle organizzazioni, di un data steward, chiamato a garantire il rispetto degli standard definiti.
Anche soggetti privati come Microsoft hanno mosso alcuni passi importanti (così come Google e Apple, che hanno lanciato un progetto comune). Con una recente decisione, infatti, l’azienda di Seattle ha raccolto la sfida degli open data (secondo The Economist, ne deriverebbe comunque un vantaggio all’azienda, non essendo la raccolta e l’uso dei dati il suo core business). Se si considera che, secondo lo stesso Presidente di Microsoft, Brad Smith, “fewer than 100 firms collect more than half of all data generated online”, una scelta di questo tipo potrebbe fare la differenza nell’approccio complessivo ai dati.
Vi sono forme di collaborazione di esperti, come il workshop ELLIS, che presenta e commenta progetti volti ad affrontare il Covid-19 “using methods of machine learning and AI, carried out by leading international researchers”. Infine, sono da menzionare le collaborazioni sugli hardware, attraverso l’open source: sette progetti, in particolare, sono volti a migliorare prassi e macchinari nell’ambito dell’emergenza. Da Opentron, che consente di automatizzare le preparazioni dei test in laboratorio, consentendone fino a 2.400 al giorno (contano di arrivare a un milione entro il 1 luglio), al Chai’s Open qPCR, che permette di diagnosticare la presenza del virus sulle superfici (come i tasti degli ascensori), fino al ventilatore di facile installazione Open Lung Low Resource Ventilator.
È bene monitorare i tentativi e i progetti di condivisione dei dati (ma anche delle conoscenze e dell’hardware, come visto): per fenomeni senza confini, ridurre la propria pretesa e “abbracciare l’altro” – anche mediante la rimozione di ostacoli tecnici e giuridici – è fondamentale non solo sul piano individuale, ma pubblico e generale.
Quest’opera è distribuita con Licenza Creative Commons Attribuzione – Non commerciale – Non opere derivate 4.0 Internazionale.