Il progetto “Human Phenotype Project”, con oltre 28 mila partecipanti, combina deep phenotyping e intelligenza artificiale per individuare precocemente segnali di malattia e sviluppare gemelli digitali predittivi. Nuove frontiere nella prevenzione
Il progetto Human Phenotype Project (Hpp) è un ampio studio prospettico avviato nel 2018 con l’obiettivo di caratterizzare in profondità il continuum tra salute e malattia attraverso il “deep phenotyping” di decine di migliaia di individui. A oggi sono stati reclutati circa 28 mila partecipanti e oltre 13 mila hanno completato la visita iniziale, che include la raccolta di dati clinici, stili di vita e multi‑omiche allo scopo di individuare nuovi marker molecolari con valore diagnostico, prognostico e terapeutico, nonché di sviluppare modelli predittivi basati su intelligenza artificiale per l’insorgenza e la progressione delle malattie.
I partecipanti all’Hpp si sottopongono ogni due anni a un protocollo di valutazione che abbraccia 17 gruppi di parametri corporei: dalle misurazioni antropometriche e dagli esami di imaging (ultrasuoni, densitometria ossea) al monitoraggio continuo del glucosio e del sonno, fino all’analisi multi‑omica che comprende genetica, trascrittomica, metabolomica, proteomica, immunoprofilazione e studio del microbioma (intestinale, vaginale e orale). Questi dati, anonimizzati e condivisi con la comunità scientifica, permettono di contestualizzare il profilo individuale rispetto a normative stratificate per età, sesso e indice di massa corporea.
Un modello di intelligenza artificiale addestrato su questa enorme mole di informazioni elabora per ogni individuo un’“età biologica” calcolata sulla base delle deviazioni dai valori attesi per ciascun parametro corporeo. Questo approccio consente di rilevare alterazioni precoci, ad esempio identificando il pre‑diabete in circa il 40 % delle persone ritenute sane dai test tradizionali, grazie alla valutazione delle variazioni del glucosio nel tempo. Lo stesso modello evidenzia differenze di genere nell’invecchiamento biologico, con un’accelerazione osservata nelle donne intorno alla menopausa, suggerendo possibili interventi ormonali mirati.
Per trasformare questi dati in uno strumento predittivo, i ricercatori hanno sviluppato un’intelligenza generativa basata su una tecnica di “imputazione”: sottraendo di volta in volta un’informazione al modello e sfidandolo a ricostruirla, si ottiene un framework capace di simulare scenari futuri e di suggerire modifiche dietetiche o terapie ottimali. In particolare, un modello multimodale di “foundation AI”, addestrato con self‑supervised learning su dati alimentari e di monitoraggio glicemico continuo, ha mostrato prestazioni superiori ai metodi esistenti nella previsione dell’insorgenza di patologie come il diabete.
Nonostante il potenziale trasformativo, rimangono criticità da affrontare prima di una piena applicazione clinica. La composizione del campione, inizialmente concentrato su fasce d’età tra 40 e 70 anni e oggi in fase di ampliamento, può introdurre bias di selezione; inoltre, la maggior parte dei dati sensibili (risultati di analisi del sangue, misurazioni antropometriche) richiede accordi specifici per l’accesso, limitando temporaneamente la replicabilità indipendente dei risultati. Le performance dei modelli predittivi vanno validate su coorti esterne e diverse per etnia e contesto ambientale, e occorre valutare gli aspetti etici e normativi legati alla gestione di un’informazione così personale.
In prospettiva, l’Hpp intende espandersi fino a 100 mila partecipanti, con filiali già operative in Giappone e in fase di lancio negli Emirati Arabi Uniti, per rafforzare la rappresentatività globale dei dati. L’obiettivo finale è integrare in un’applicazione consultabile i risultati in tempo reale, permettendo a ogni individuo di visualizzare il proprio “percorso di salute” e di ricevere raccomandazioni preventive personalizzate basate sull’evoluzione futura prevista per il proprio “gemello digitale”. Sebbene il gemello digitale rappresenti oggi un prototipo di ricerca, la sua evoluzione potrà orientare in modo più preciso le strategie preventive e terapeutiche, a condizione di completare le fasi di validazione, standardizzazione e regolamentazione.