Indica un intervallo di date:
  • Dal Al
scienze

L’anno del forecast (anche in medicina)

L’intelligenza artificiale sta trasformando profondamente il modo in cui concepiamo la prevenzione sanitaria. Non si tratta più solo di indicazioni generiche su dieta, esercizio fisico o controlli periodici, ma di strumenti in grado di stimare in modo personalizzato i rischi futuri di malattie, evidenziando chi necessita di attenzione e in quali momenti della vita.
Questo approccio, che possiamo definire forecasting sanitario, promette di rivoluzionare la comunicazione della prevenzione, spostandola da messaggi generici a strategie basate su dati individuali, abitudini e indicatori fisiologici. Nel mondo degli affari, il forecasting funziona sulla base di un principio semplice: comportamenti passati, come trend, cicli o pattern ricorrenti, tendono a ripetersi nel tempo. Applicato alla salute, significa costruire modelli in grado di proiettare nel futuro i rischi di malattia a partire da dati storici solidi e accurati, aprendo la strada a una prevenzione più mirata e predittiva.

Un esempio proveniente dalla Icahn School of Medicine at Mount Sinai, a New York l’abbiamo già raccontato. Due ulteriori studi pubblicati negli ultimi mesi entrambi dal gruppo Nature, uno a gennaio 2026 e l’altro a settembre 2025 ne sono fulgidi esempi.

a , Configurazione PSG e statistiche del set di dati in diversi centri del sonno. Le barre mostrano il numero di registrazioni PSG indipendenti (partecipanti) per coorte e le corrispondenti ore totali di registrazione. b , Preaddestramento contrastivo multimodale: i segnali grezzi di ciascuna modalità sono codificati da una CNN, gli embedding dei canali sono raggruppati all’interno della modalità e un trasformatore temporale con pooling temporale produce rappresentazioni a livello di sequenza per LOO-CL. C: canali, S: lunghezza della sequenza, D: dimensione dell’embedding. c , Ottimizzazione tramite embedding congelati per attività a valle (stadiazione del sonno, rilevamento dell’apnea, previsione della malattia). Otto ore di embedding multimodali vengono aggregate in rappresentazioni a livello di paziente, concatenate con età e sesso e passate a un LSTM seguito da un livello completamente connesso. d , Valutazione tra attività rappresentative e applicazioni cliniche. A sinistra e al centro: matrici di confusione per le categorie di stadiazione del sonno (SHHS) e AHI (SSC) mostrate come percentuali normalizzate per riga. A destra: performance di previsione della malattia nella coorte di Stanford ( n  = 5.019 partecipanti). I box plot riassumono 1.000 ricampionamenti bootstrap a livello di paziente: punti deboli (disegni bootstrap individuali) e linea verticale con estremità (IC percentile bootstrap al 95%). Le etichette numeriche rappresentano le medie. Numero di campioni positivi per ciascuna malattia: CKD (354), decesso (224), demenza (221), scompenso cardiaco (283) e ictus (297).

Dal sonno alla prevenzione: l’IA che legge il futuro della salute

Un team dell’Università di Stanford ha costruito un sistema che si basa su SleepFM, un modello di intelligenza artificiale in grado di prevedere più di cento condizioni di salute utilizzando dati raccolti durante una sola notte di sonno. La base di partenza è la polisonnografia, una tecnica di monitoraggio del sonno che registra contemporaneamente attività cerebrale, cardiaca, respiratoria, movimenti oculari e muscolari. Questo approccio consente di ottenere un quadro estremamente dettagliato della fisiologia notturna, trasformando ogni notte di sonno in una miniera di informazioni sul funzionamento del corpo.

SleepFM è stato addestrato su quasi seicentomila ore di dati raccolti da 65.000 partecipanti in 25 anni, tra il 1999 e il 2024, con una combinazione di dati e cartelle cliniche elettroniche. Il modello analizza i dati segmentandoli in unità di cinque secondi, come se fossero parole in un testo, e impara le relazioni tra i diversi segnali fisiologici, creando una sorta di linguaggio del sonno. In questo modo, non solo è in grado di classificare le fasi del sonno o diagnosticare l’apnea notturna, ma può anche identificare anomalie che anticipano il rischio di malattie future.

a , I tassi previsti per nove diagnosi esemplari e la mortalità ( asse y ) in funzione dell’età ( asse x ). I punti mostrano le previsioni per ciascun token di input registrato. I colori separano il sesso biologico; i colori più scuri indicano le previsioni immediatamente prima della diagnosi in questione. Le linee viola e turchese rappresentano i tassi di malattia osservati per ogni intervallo di età annuale nei dati di addestramento. La linea nera continua collega le previsioni consecutive per un caso selezionato casualmente per tutta l’età. b , Valori medi dell’AUC stratificati per età e sesso ( asse y ) in funzione delle occorrenze di addestramento ( asse x ). Sono mostrati i dati per n  = 906 diagnosi per individui di sesso maschile e n  = 957 diagnosi per individui di sesso femminile per i quali è stato registrato un numero sufficiente di eventi nei dati di convalida per valutare i valori dell’AUC. c , Come b , ma aggregati per il capitolo ICD-10. d , Come b , aggregati per sesso. e , Valori dell’AUC di tutte le diagnosi in b per diversi intervalli di tempo tra previsione e diagnosi ( asse x ). f , curve ROC per Delphi e altri metodi clinici o di apprendimento automatico per tre endpoint selezionati valutati sul set di test longitudinali interni. g , valori AUC di MILTON 31 , un modello di apprendimento automatico basato su biomarcatori ( asse x ), in modalità prognostica, confrontati con i valori AUC di Delphi-2M dal set di convalida della UK Biobank ( asse y ) per n  = 410 diagnosi. I box plot in c – e mostrano la mediana (linea centrale), dal primo al terzo quartile (limiti del box) e i quantili 0,025 e 0,975 (baffi).

I risultati sono notevoli: SleepFM ha individuato 130 malattie prevedibili con buona accuratezza, tra cui Parkinson, demenza, infarti e alcuni tumori come quelli alla prostata e al seno. L’efficacia emerge soprattutto quando i segnali fisiologici non sono sincronizzati, ad esempio quando un cuore resta attivo mentre il cervello sembra addormentato, indicando potenziali rischi futuri. SleepFM dimostra che l’analisi dei dati fisiologici può diventare uno strumento predittivo potente, utile per individuare persone che potrebbero beneficiare di interventi preventivi.

Delphi-2M: 20 anni di salute in un modello di intelligenza artificiale

A settembre 2025, un gruppo di ricercatori europei ha sviluppato un modello ancora più ambizioso, Delphi-2M, in grado di stimare il rischio di oltre mille malattie nei successivi vent’anni. A differenza di SleepFM, che analizza dati fisiologici puntuali, Delphi-2M lavora su dati clinici e informazioni sullo stile di vita, imparando le sequenze temporali di diagnosi, trattamenti e fattori di rischio per prevedere eventi futuri.

Il modello è stato addestrato su 400.000 partecipanti della UK Biobank e testato su 1,9 milioni di pazienti del Danish National Patient Registry. Utilizza un approccio simile a quello dei grandi modelli linguistici: impara la “grammatica” dei dati sanitari e riconosce schemi ricorrenti nella progressione delle malattie. Le previsioni non sono certezze, ma stime probabilistiche analoghe alle previsioni del tempo: più accurate nel breve periodo, meno affidabili su orizzonti più lunghi, con performance migliori per condizioni con progressione prevedibile come alcuni tumori, infarti e setticemie, e più limitate per patologie variabili come disturbi mentali o complicazioni in gravidanza.

Delphi-2M consente già di comprendere come le malattie si sviluppano nel tempo, stimare l’impatto dello stile di vita sui rischi e simulare scenari sanitari in assenza di dati reali, offrendo strumenti preziosi per interventi preventivi più mirati. Con dati sufficientemente rappresentativi, modelli come Delphi-2M potrebbero aiutare clinici e sistemi sanitari a identificare pazienti ad alto rischio, pianificare interventi precoci e allocare risorse in maniera più efficiente.

Perché è interessante

SleepFM e Delphi-2M mostrano una tendenza comune: l’intelligenza artificiale non si limita più a diagnosticare ciò che è già presente, ma anticipa i rischi futuri, rendendo possibile una prevenzione più mirata e personalizzata. L’attenzione si sposta dai sintomi attuali ai rischi potenziali, consentendo di comunicare la prevenzione in maniera più efficace e basata su dati concreti. Le persone potrebbero ricevere indicazioni precise su quali controlli eseguire e quando, con una strategia simile a una previsione meteorologica applicata alla salute.
I benefici potenziali riguardano sia i cittadini che i sistemi sanitari. Con l’invecchiamento della popolazione e l’aumento delle malattie croniche, la possibilità di stimare i rischi futuri permette di pianificare interventi precoci, prevenire complicazioni e ottimizzare l’uso delle risorse. Questi strumenti potrebbero rendere la prevenzione più efficace e ridurre l’onere delle malattie, spostando il sistema sanitario da un approccio reattivo a uno proattivo.

Limiti e sfide: privacy, bias e incertezze

Nonostante le potenzialità, entrambi i modelli presentano limiti importanti. SleepFM richiede dati di polisonnografia e quindi non è facilmente accessibile alla popolazione generale. Delphi-2M contiene bias derivanti dalla composizione dei dati della UK Biobank, sotto-rappresentando bambini, adolescenti e alcune minoranze etniche. Inoltre, il forecasting sanitario non offre certezze assolute, ma stime probabilistiche, con maggiore accuratezza nel breve periodo rispetto a scenari di lungo termine.

Per approfondire. 

Dalla previsione del gene a quella della variante: nasce V2 il modello di Ai per la medicina che studia il Dna

Decisioni automatizzate, vite reali. Nella sanità del futuro, siamo ancora noi a decidere?

L’impatto del Covid-19 sulla salute mentale. Torna Data Analysis

Gli stereotipi di genere nel parlamento italiano, da De Gasperi ai giorni nostri #DataAnalysis

Votare per o votare contro. Il pericolo del partyism in politica (in Italia e negli Stati Uniti)

Come si misura la solitudine e la felicità

“Quando nella scienza non ci sono dati allora è pubblicità”

Riaprono le discoteche. Dopo mesi di sofferenza e anni di bilancio in rosso #DataAnalysis