L’intelligenza artificiale ha fatto una scoperta straordinaria: oltre 161.000 nuove specie di virus a RNA sono state identificate grazie a un sofisticato algoritmo di apprendimento profondo. Questo risultato, secondo gli esperti, non solo amplia la nostra comprensione della vita sulla Terra, ma apre la strada alla scoperta di milioni di altri virus ancora sconosciuti. Lo studio, condotto da Edwards Holmes della School of Medical Sciences dell’Università di Sydney e pubblicato sulla rivista Cell, è il più grande progetto di identificazione virale mai realizzato. “Ci è stata offerta una finestra su una parte altrimenti nascosta della vita sulla Terra, rivelando una notevole biodiversità“, ha dichiarato Holmes, autore senior dello studio.
Holmes ha spiegato che “si tratta del maggior numero di nuove specie virali scoperte in un unico studio, che amplia in modo massiccio la nostra conoscenza dei virus che vivono tra noi“. L’impiego dell’intelligenza artificiale ha permesso di trovare e classificare questi virus con una velocità e una precisione senza precedenti: “Trovare così tanti nuovi virus in un colpo solo è sbalorditivo e non fa che scalfire la superficie, aprendo un mondo di scoperte“. Infatti, Holmes è convinto che ci siano “altri milioni da scoprire e possiamo applicare lo stesso approccio all’identificazione di batteri e parassiti“.
Nonostante i virus a RNA siano spesso associati alle malattie umane, sono stati rinvenuti in ambienti estremi in tutto il mondo, come l’atmosfera, sorgenti calde e bocche idrotermali, suggerendo che potrebbero svolgere un ruolo fondamentale negli ecosistemi globali. Holmes ha commentato: “Il fatto che gli ambienti estremi ospitino così tanti tipi di virus è solo un altro esempio della loro fenomenale diversità e della loro tenacia nel vivere negli ambienti più difficili, e potenzialmente ci fornisce indizi su come sono nati i virus e altre forme di vita elementari“.
Per raggiungere questo risultato, i ricercatori hanno sviluppato un algoritmo di apprendimento profondo chiamato LucaProt, capace di analizzare enormi quantità di dati genetici, tra cui genomi virali lunghi fino a 47.250 nucleotidi. Questo sistema ha permesso di identificare oltre 160.000 virus a RNA. “La stragrande maggioranza di questi virus era già stata sequenziata e si trovava in banche dati pubbliche, ma erano così divergenti che nessuno sapeva cosa fossero“, ha spiegato Holmes, definendoli “quella che viene spesso definita ‘materia oscura’ delle sequenze“.
Grazie all’IA, gli scienziati sono riusciti a dare un senso a questa “materia oscura“: “Il nostro metodo di intelligenza artificiale è stato in grado di organizzare e classificare tutte queste informazioni disparate, facendo luce per la prima volta sul significato di questa materia oscura“, ha aggiunto Holmes. L’intelligenza artificiale, infatti, è stata addestrata a identificare i virus basandosi sulle sequenze e sulle strutture secondarie delle proteine che tutti i virus a RNA utilizzano per la replicazione, accelerando notevolmente il processo di scoperta rispetto ai metodi tradizionali.
Mang Shi, coautore dello studio e responsabile della Sun Yat-sen University, ha sottolineato come in passato la scoperta dei virus fosse “limitata da noiose pipeline bioinformatiche, che limitavano la diversità che potevamo esplorare“. Oggi, grazie a questo nuovo modello basato sull’intelligenza artificiale, “disponiamo di una sensibilità e una specificità eccezionali, che ci permettono di approfondire la diversità virale“. Shi ha poi annunciato: “Abbiamo intenzione di applicare questo modello in diverse applicazioni“.
Anche Zhao-Rong Li, ricercatore presso l’Apsara Lab di Alibaba Cloud Intelligence, ha evidenziato l’importanza di LucaProt come “un’integrazione significativa tra la tecnologia AI all’avanguardia e la virologia, dimostrando che l’AI può svolgere efficacemente compiti di esplorazione biologica“. Secondo Li, questa scoperta “fornisce preziose intuizioni e incoraggia l’ulteriore decodifica delle sequenze biologiche e la decostruzione dei sistemi biologici da una nuova prospettiva“.
Il lavoro non si ferma qui. Come ha concluso Holmes: “L’ovvio passo successivo è quello di addestrare il nostro metodo per trovare un numero ancora maggiore di questa straordinaria diversità, e chissà quali altre sorprese sono in serbo“.