SCIENZA E RICERCA

È possibile prevedere il futuro dell’evoluzione?

Quella dell’evoluzione è una storia complessa e avvincente, piena di cambi di direzione, colpi di scena e risvolti inaspettati. Sono molti, infatti, i fattori che ne influenzano il corso, tra cui i mutamenti del clima e dell’ambiente, la demografia e l’aumento o la diminuzione della competizione con altre specie. È legittimo ritenere, quindi, che sia impossibile prevedere come evolverà una specie in futuro. La biologia evoluzionistica viene infatti considerata prevalentemente come una scienza descrittiva e storica. Nonostante ciò, in questo ambito di ricerca si dibatte ancora molto riguardo alla possibilità di predire, almeno in parte, i processi evolutivi.

Questo dibattito è particolarmente attuale oggi che i cambiamenti climatici espongono al rischio d’estinzione molte specie animali e vegetali e le costringono ad adattarsi a nuove condizioni ambientali; perciò, capire come potrebbe evolvere una specie in futuro potrebbe aiutarci a stimare il suo grado di vulnerabilità a determinati ambienti e anche ad alcune patologie. Ma non solo. Ricerche di questo tipo possono focalizzarsi anche sugli agenti patogeni in questione: di questo filone di ricerca fanno parte alcuni studi che tentano di ricostruire la storia evolutiva di alcuni microrganismi – come virus e batteri – per provare a capire come muteranno in futuro e valutare, quindi, il rischio di antibiotico resistenza.

Questo approccio è stato adottato da tre studiosi dell’università di Nottingham – James McInerney, Alan Beavan e Maria Rosa Domingo-Sananes – che hanno condotto uno studio basato sull’analisi del pangenoma di un batterio intestinale, l’Escherichia coli.

Il pangenoma è l’insieme di tutti i geni presenti in un insieme di esemplari della stessa specie. Semplificando molto il discorso, possiamo immaginare il pangenoma come un alfabeto che comprende tutte le lettere di cui sono composte tutte le parole del vocabolario di una certa lingua. Naturalmente, ogni singola parola si differenzia dalle altre proprio perché contiene alcune delle lettere che compongono l’alfabeto.

Gli autori hanno costruito il pangenoma dell’Escherichia coli a partire da un dataset che comprendeva 2500 genomi completi di questa specie batterica, che è caratterizzata da un’alta variabilità genetica tra i moltissimi ceppi esistenti. Il loro obiettivo era quello di capire se fosse possibile individuare dei modelli ripetuti e prevedibili a livello del pangenoma.

Hanno dato in pasto tutti questi dati a un sistema di apprendimento automatico chiamato Random forest, che ha trascorso diverse centinaia di migliaia di ore a elaborarli per individuare modelli di coevoluzione, ovvero casi in cui la presenza o l’assenza di determinati geni era associata alla presenza o all’assenza di altri geni. Ciò avrebbe implicato l’esistenza di alcune correlazioni tra geni che possono essere identificate all’interno del pangenoma. Random forest era in grado di rilevare sia correlazioni semplici tra coppie di geni, sia relazioni più complesse che coinvolgevano più geni (casi in cui, ad esempio, la presenza di un ipotetico gene A era associata alla presenza di un gene B solo in assenza di un gene C).

I ricercatori sono riusciti effettivamente a individuare un sottoinsieme dei geni dell’Escherichia coli che era possibile prevedere con un accettabile grado di certezza. Hanno identificato, in particolare, tre tipi di “regole” che influenzano la composizione del genoma di questo procariota: in alcuni casi, la presenza di uno specifico gene aumentava la probabilità di rilevarne un altro, e viceversa (ciò non esclude comunque la possibilità che la selezione di entrambi i geni dipenda da un terzo fattore non identificato); esistevano poi casi in cui la presenza di un gene aumentava la probabilità che ne comparisse un altro, ma non viceversa (come se il secondo, in altre parole, “dipendesse” dal primo); esistevano poi alcuni geni che tendevano a non comparire mai insieme nel dna di questi batteri (quasi come se la presenza dell’uno scongiurasse la presenza dell’altro). Come sottolineano gli studiosi, è bene specificare che questi geni non hanno un “comportamento”: le spiegazioni appena proposte servono piuttosto a descrivere i modelli di co-occorrenza osservati dagli autori.

La possibilità di individuare tali modelli costituisce un risultato che gli autori definiscono rivoluzionario. La loro scoperta supporta infatti l’ipotesi secondo la quale la selezione dei tratti genetici non dipende solo da fattori ambientali, ma segue anche delle regole intrinseche che accompagnano la storia evolutiva di una specie a prescindere dalle condizioni esterne. Gli autori sostengono, perciò, che le traiettorie evolutive non siano del tutto casuali, bensì in parte deterministiche, poiché le probabilità che un certo gene venga acquisito oppure perduto nel corso dell’evoluzione può essere stimata valutando la presenza o l’assenza di altri geni (che gli studiosi definiscono “predittori”).

Studi di questo tipo potrebbero allargare perciò gli orizzonti delle scienze farmacologiche e della medicina personalizzata permettendo di individuare, ad esempio, i predittori dei geni che codificano la resistenza agli antibiotici nei patogeni, oppure ispirando la progettazione di terapie genetiche innovative. Gli autori ritengono quindi che modelli di apprendimento automatico come Random forest possano rivelarsi particolarmente utili nel dibattito scientifico sulla contingenza e il determinismo nell’evoluzione delle specie e ipotizzano che combinando diversi approcci computazionali si potrebbero ottenere risultati più approfonditi.

© 2018 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012