Indica un intervallo di date:
  • Dal Al
cronaca

La mappa che racconta 40 anni di migrazioni: come l’intelligenza artificiale ha ricostruito i movimenti della popolazione mondiale

Dove si spostano le persone nel mondo? È una domanda apparentemente semplice, ma sorprendentemente difficile da affrontare con i dati. Molti Paesi non registrano in modo sistematico chi entra e chi esce dai propri confini, le definizioni di migrante cambiano da uno Stato all’altro e le statistiche disponibili sono spesso incomplete. Per questo motivo la mappa pubblicata su Nature da Guy Abel, James Gaskin e colleghi rappresenta un passo avanti importante: offre una ricostruzione annuale dei flussi migratori tra 230 Paesi e territori dal 1990 al 2023.

 

 

a, Fraction of corridors that have reported flow values in the 1990–2020 period by any of the validation datasets used in this work7,66,67,68,69. Statistics for both origin- and birth-destination corridors are shown; these are further disaggregated by corridors for which neither, only one of, or both the sending and the receiving country has reported figures. b, Migration flow estimates based on domicile registration (usually with a local authority) are available for a small number of countries, but the discrepancies can be large: estimates of flows—based on registrations of people arriving from Poland as reported by German authorities (red) and de-registrations of people leaving Poland for Germany, as reported by Polish authorities (blue)7—are shown. The harmonized QuantMig estimates (orange; error bands show the 97.5% quantile) and the recent digital-trace estimates based on Facebook data are also shown. c, Various estimates of the net migration for France, such as those from the UN Population Division’s World Population Prospects (2024 Revision), the US Census Bureau (USCB)’s International Dataset70, and the French National Institute of Statistics and Economic Studies (INSEE)71. d, UN DESA estimates of the migrant stock of Somalians in Ethiopia, which do not agree across revisions. In some cases, they are based on refugee data figures from the UNHCR72.

I dati li trovate qui su Hugging Face mentre il codice utilizzato per addestrare le reti, generare i campioni e valutare i modelli addestrati è disponibile su GitHub 

La mappa globale che emerge  mostra i principali corridoi migratori del pianeta. A colpo d’occhio emergono alcune delle grandi direttrici della mobilità contemporanea: i flussi verso il Nord America, quelli interni all’Europa, i movimenti tra Paesi asiatici e le migrazioni originate da aree colpite da crisi economiche, conflitti o instabilità politica. Più che una fotografia, è un film lungo oltre trent’anni che consente di osservare come le rotte migratorie cambino nel tempo.

L’aspetto più interessante, però, non è la mappa in sé ma il metodo utilizzato per costruirla. I ricercatori hanno raccolto fonti molto diverse tra loro: censimenti nazionali, statistiche ufficiali sui flussi, dati sugli stock di migranti residenti all’estero, stime delle Nazioni Unite e ricostruzioni precedenti. Nessuna di queste fonti, da sola, è sufficiente a descrivere la mobilità globale. La novità è stata combinarle in un unico sistema.

For each edge, the covariates χbij, the migrant stock (Sbi, Sbj), and the latent state zbij are passed through the neural network uθ to produce an estimated flow
and an updated latent variable zbij(t + 1). The complete flow table T is assembled from all the individual estimates and used to calculate the net migration M, the origin-destination flow F, and the migrant stock S(t + 1) of the next year, which is then fed back into the neural network as input. This gives a recursive training procedure. b Input and target data are transformed to more closely resemble a normal distribution (dashed line) using a Yeo-Johnson type transformation (eq. (8)). This is done by tuning the parameter λ using maximum likelihood estimation. c The training loss J is calculated from the residuals of the prediction and the observation data. Each term is weighted by the uncertainty on the target value, with smaller uncertainties leading to a higher weight (represented by a thicker bar). d/e Two covariates used to train the model. The bilateral religious similarity score for Nigeria (d), measuring the overlap in adherents of major religions with other countries, and real GDP per capita, in constant 2015 USD, as of 2019 (e).

Per farlo il gruppo di ricerca ha utilizzato un insieme di reti neurali e tecniche di deep learning. I modelli sono stati addestrati a riconoscere le relazioni tra migrazioni e variabili geografiche, economiche, culturali e politiche. In pratica, l’intelligenza artificiale ha imparato a colmare i vuoti presenti nei dati e a stimare i flussi laddove le informazioni mancavano o erano incomplete. Il risultato è una banca dati annuale molto più dettagliata rispetto alle precedenti ricostruzioni, che spesso fornivano soltanto stime ogni cinque anni.

Un altro elemento rilevante è che lo studio non restituisce solo una stima puntuale. Gli autori hanno incorporato nei risultati anche l’incertezza delle previsioni. Nella mappa compaiono infatti aree del mondo in cui i dati restano più fragili e dove sarebbe necessario investire maggiormente nella raccolta statistica. È un approccio importante perché ricorda che i dati sulle migrazioni non sono osservazioni dirette della realtà, ma il risultato di modelli che devono fare i conti con informazioni spesso incomplete.

Il commento pubblicato sempre su Nature sottolinea proprio questo aspetto: la combinazione tra fonti statistiche tradizionali e intelligenza artificiale produce probabilmente il quadro più completo mai realizzato sui movimenti migratori globali. Non elimina i limiti dei dati disponibili, ma permette di osservare fenomeni che fino a oggi restavano nascosti nelle lacune delle statistiche nazionali.