Di Big Data si parla spesso e, sempre più di frequente, viene discusso il loro utilizzo anche nell’ambito del Sistema Salute. Tuttavia, non è sempre chiaro come i dati scientifici raccolti possano essere effettivamente utilizzati nell’ambito medico-sanitario. Secondo la definizione ufficiale della Comunità Europea “i Big Data in Sanità si riferiscono a grandi set di dati raccolti periodicamente o automaticamente, che vengono archiviati elettronicamente, riutilizzabili allo scopo di migliorare le prestazioni del sistema sanitario”. Si tratta dunque di un aspetto fondamentale di qualsiasi attività di ricerca, che si è trasformato grazie allo sviluppo tecnologico e informativo.

A partire dagli anni ’80, la capacità di archiviazione digitale nel mondo è cresciuta esponenzialmente, raddoppiando ogni 40 mesi; solo nel 2020, ogni 2 giorni sono stati creati 5 miliardi di Gigabyte di dati. In ambito sanitario, il tasso di crescita dei dati generati è anche superiore alla media registrata in altri settori. Esistono migliaia di terabyte di dati medici e scientifici, distribuiti da progetti di ricerca, pubblicazioni e cartelle cliniche digitali. 

Se analizzati attentamente e con gli strumenti adeguati, i Big Data dare la giusta spinta alla ricerca in ambito sanitario, non solo per quanto riguarda la produzione di nuovi farmaci, ma anche per la scelta di un nuovo trattamento clinico. Rappresentano infatti un patrimonio informativo ampissimo che può portare innumerevoli vantaggi nei percorsi diagnostico-terapeutici, nella ricerca scientifica e nella programmazione sanitaria, permettendo di definire la cura migliore per il singolo paziente, riducendo i tempi necessari per identificare nuove promettenti molecole e supportando politiche di salute pubblica più consapevoli, in funzione degli effettivi bisogni della popolazione, ma anche favorendo una sorveglianza sanitaria proattiva, per il controllo tempestivo delle emergenze pandemiche.

L’immensa quantità di dati di cui dispone il Sistema Salute è però molto frammentata, perché deriva da innumerevoli fonti diverse (dalla cartella clinica al fascicolo sanitario elettronico, dai dati di imaging a quelli provenienti da device indossabili e App) e non viene raccolta secondo modalità omogenee. Una tale complessità di informazioni richiede strumenti di analisi sempre più sofisticati: diventa così essenziale creare strategie combinate che uniscono i migliori ingegni tra medici, esperti di ricerca avanzata in ambito matematico e di analisi informatica, per riuscire a trarre dai dati il massimo della conoscenza. 

Su questo fronte l’Italia sta dando una grande accelerata, stanziando il triplo degli investimenti della Germania e il doppio della Francia per l’informatizzazione della medicina. Per identificare dei fattori comuni di raccolta e analisi dei dati, è nato il progetto Health Big Data, finanziato dal Ministero della Salute con un investimento pari a 55 milioni di euro, tra i più importanti mai stanziati in questo ambito, che coinvolge i 51 IRCCS italiani (la Rete Cardiologica, Oncologica, Pediatrica, delle Neuroscienze e Neuroriabilitazione), in collaborazione con il Politecnico di Milano e l’Istituto Nazionale di Fisica Nucleare. Il progetto, che si articola su 10 anni, punta a costruire una piattaforma IT federata, che permetta di valorizzare quanto già presente nei singoli IRCCS e nelle loro Reti per raccogliere, condividere e processare i dati clinico-scientifici dei pazienti, codificandoli in modo uniforme.

Nel frattempo  si stanno diffondendo in tutto il territorio nazionale, sebbene non in maniera del tutto omogenea, strumenti come il Fascicolo Sanitario Elettronico, i nuovi sistemi CUP, il taccuino dell’assistito, il dossier sanitario e la Cartella Clinica Elettronica: tutte innovazioni che vanno nella direzione della dematerializzazione delle informazioni e quindi anche della raccolta di informazioni integrate e a disposizione dei medici. 

Per efficientare questi strumenti si rende necessaria l’adozione di un approccio integrato, che tenga in considerazione uno spettro di raccolta dati più ampio, ma anche una maggiore attenzione alla professionalità necessaria per gestire e coordinare i Big Data: Data Scientist e Data Analyst sono professioni nuove, che combinano competenze matematiche, tecnologiche e statistiche messe infine a disposizione di un’organizzazione per consentirle di crescere e migliorare.

Contemporaneamente, contribuiscono anche allo sviluppo di piattaforme e software di gestione ed analisi dei Big Data in medicina. E laddove la mole di dati da analizzare supera le capacità del ricercatore, la machine learning viene allora in aiuto del settore offrendo strumenti che permettano di interpretare al meglio il significato dei dati stessi, garantendo così un futuro più ricco di informazioni per la ricerca medico-sanitaria.