Come usare meglio l’IA per la ricerca sul cancro
Un nuovo progetto finanziato da un AIRC Start-up Grant punta a superare i limiti attuali dei modelli AI applicati alla multi-omica, aprendo la strada a innovazioni nel campo dell’oncologia di precisione
I modelli AI stanno rivoluzionando la ricerca sul cancro: possono rilevare pattern tipici del cancro, identificare mutazioni genetiche o aiutare ad analizzare le immagini diagnostiche. Ci sono però ancora dei seri limiti a quello che gli attuali modelli AI possono fare. In un progetto finanziato da un AIRC Start-up Grant, Charlotte Ng − Professoressa Associata di Genetica presso Humanitas University − e il suo team studieranno approcci innovativi per superare gli attuali limiti dei modelli di IA applicati ai dati che derivano dalle scienze omiche, un lavoro che potrebbe aprire la strada a progressi nell’oncologia personalizzata.
“Vogliamo sfruttare meglio l’intelligenza artificiale per la ricerca sul cancro”, spiega Charlotte Ng, che dirige il Computational Biology Lab presso l’Istituto Clinico Humanitas. I modelli AI ampliano le nostre possibilità di analizzare in modo integrato i dati multi-omici, ossia i dati molecolari provenienti da fonti diverse, come la genomica e la trascrittomica. “Nella ricerca sul cancro, e soprattutto nel campo dell’oncologia di precisione, i modelli attuali spesso ci limitano a utilizzare un solo tipo di dati alla volta. In questo progetto vogliamo sviluppare un approccio all’AI per sfruttare davvero il vasto potenziale dei dati multi-omici”.
Conoscenze complementari
Quali sono i limiti che il progetto di Charlotte Ng vuole superare? “Il primo limite è che la maggior parte dei modelli AI considera i dati multi-omici come indipendenti tra loro. Ma da una prospettiva biologica, sappiamo che questi dati non lo sono”. Le alterazioni del DNA, per esempio, avranno un impatto sulla trascrizione dell’RNA, che a sua volta avrà un effetto sulla sintesi delle proteine. “Vogliamo quindi sfruttare l’interdipendenza di questi diversi tipi di dati per capire meglio i processi biologici”, spiega Ng.
Inoltre, la maggior parte dei sistemi di intelligenza artificiale in uso oggi è impostata per lavorare con set di dati completi, composti da più tipi di dati. “In questo tipo di modelli, i campioni con dati mancanti vengono esclusi”. Ma molti fattori, dal costo alle dimensioni del tessuto campione, spesso limitano la possibilità di generare tipi diversi di dati molecolari da un singolo campione. Avere modelli che ne tengano conto è importante perché permetterebbe di usare anche questi set di dati, incompleti ma comunque preziosi, e di evitare il rischio di bias dovuti alla frammentarietà dei dati.
Il progetto svilupperà modelli di deep learning basati su reti neurali per rappresentare i diversi tipi di dati in modo integrato, invece che separatamente. “Vogliamo usare queste conoscenze complementari per identificare caratteristiche che ci aiutino a capire la prognosi del cancro, e che potrebbero aiutare a identificare sottogruppi di pazienti [in base alle caratteristiche della patologia]”.
Per testare questo approccio, il progetto partirà dal carcinoma epatocellulare (HCC), un tipo di tumore al fegato la cui incidenza è in aumento in Europa e in altri Paesi occidentali, ma per il quale le opzioni di cura sono limitate. “Svilupperemo un modello per identificare biomarcatori prognostici per il carcinoma epatocellulare”, spiega Charlotte Ng. Ng lavora su questo tipo di tumore al fegato da diversi anni, da quando era ricercatrice associata sotto la guida del prof. Luigi M. Terracciano all’Ospedale Universitario di Basilea, in Svizzera. Lì, si è concentrata sugli ambiti della bioinformatica del cancro e della biologia computazionale. “Sono sempre stata molto interessata a questi campi di ricerca, fin da quando mi sono dedicata alla bioinformatica durante la mia laurea all’Università del New South Wales, in Australia”, racconta Charlotte Ng. Da allora, la ricercatrice è passata da Cambridge, nel Regno Unito (per un dottorato in oncologia), fino al Memorial Sloan Kettering Cancer Center di New York e ad altri istituti di ricerca di alto livello a Basilea e Berna, prima di approdare a Humanitas nel 2023.
Un’AI più utile per i medici e i pazienti
“Pur avendo una formazione classica da bioinformatica, ho molta esperienza di lavoro nei laboratori sperimentali, fianco a fianco con i biologi, con i quali ho tuttora collaborazioni molto strette. Spesso chi fa bioinformatica non è abbastanza consapevole delle interpretazioni biologiche o, viceversa, chi si occupa di biologia non è esposto alla bioinformatica”. Questa collaborazione è fondamentale, sottolinea Ng, anche perché oggi l’attenzione per la bioinformatica sta crescendo. “Dobbiamo imparare a parlare la stessa lingua, conoscere la terminologia e il modo in cui le cose vengono fatte”.
A Humanitas, Ng promuove questa mentalità collaborativa organizzando seminari interni mensili per i bioinformatici. “La maggior parte di loro lavora in laboratori di biologia e a volte i loro PI sono clinici o biologi. Cerco di contribuire, fornendo una prospettiva diversa sugli aspetti più tecnici dei loro progetti. Ogni mese abbiamo una persona interna che presenta al resto del gruppo, così abbiamo l’opportunità di sentire cosa fanno gli altri”, spiega Charlotte Ng.
Ng insegna anche bioinformatica a vari livelli, dagli studenti di medicina ai dottorandi. In questo contesto, la partnership con l’Università Bocconi ha dato vita al Corso di Laurea Magistrale in Data Analytics and Artificial Intelligence in Health Sciences (DAIHS). Si tratta di un programma biennale che mira a formare specialisti in grado di implementare metodi di IA e Machine Learning nel settore sanitario.
Sviluppare nuovi approcci per i modelli AI significa rendere questi sistemi più utili per i medici e i pazienti, a partire dall’usare meglio il tesoro di dati clinici generati dagli ospedali di ricerca, commenta Ng. “Vorrei che gli approcci di AI e la scienza dei dati diventassero parte della gestione clinica, in modo da aiutare i medici a prendere decisioni cliniche, a identificare nuovi farmaci o a trovare le migliori opzioni di trattamento per i singoli pazienti”.