iStock
Quando venne pubblicata nel 2001 la prima sequenza di un genoma umano, la notizia fu presentata e accolta come un’impresa, per le scienze della vita, equivalente a quella spaziale dello sbarco sulla luna.
La mappatura del genoma aveva però ancora dei buchi, che furono riempiti solo 20 anni più tardi, nel 2022, con tecnologie di sequenziamento più potenti e molto più economiche. La conoscenza dei 3 miliardi di coppie di basi nucleotidiche che compongono il nostro patrimonio genetico ha rivoluzionato la comprensione della nostra biologia, ma la rivoluzione rimane ancora oggi incompiuta.
Quando si parla di genetica di popolazioni e di specie, inclusa quella umana, una parola chiave è diversità. In pochi ricorderanno che il DNA sequenziato a inizio millennio apparteneva per oltre il 70% a un solo individuo: the guy from Buffalo, “il tizio da Buffalo” veniva chiamato. La sua identità anagrafica resta sconosciuta, ma sappiamo si trattava di una persona di origini afroamericane ed europee che aveva risposto a un annuncio pubblicato su un giornale della città dello stato di New York affacciata sul lago Erie al confine con il Canada e che aveva accettato di donare, nel 1997, il proprio patrimonio genetico al Progetto Genoma Umano. Il restante 30% di quella prima sequenza era stata composta da porzioni di DNA proveniente da una ventina di altre persone.
Per quanto preziosa e utilizzata come riferimento per una miriade di studi compiuti negli ultimi due decenni, quella sequenza da sola non rappresenta tutta la variabilità genetica umana.
Per colmare questa lacuna è nato, nel 2019, il Consorzio per il Pangenoma Umano (Human Pangenome Reference Consortium) che a inizio maggio ha pubblicato la bozza del primo pangenoma, derivato da un incrocio delle caratteristiche genetiche di 47 persone: 24 di discendenza africana, 16 dalle Americhe e dai Caraibi, 6 dall’Asia e 1 dall’Europa.
Il risultato non è più una sequenza lineare, ma piuttosto una serie di linee parallele che assomiglia più alla mappa di una metropolitana, hanno spiegato su Nature i ricercatori che hanno lavorato al progetto.
News: Scientists release a new human “pangenome” reference https://t.co/L79hsLlJBB
— NIH (@NIH) May 10, 2023
Il direttore del National Human Genome Research Institute Eric Green, l’agenzia governativa statunitense che ha finanziato il lavoro, ha spiegato al New York Times la rilevanza dell’impresa con una metafora automobilistica: mentre prima ogni meccanico aveva le istruzioni per un solo tipo di auto, ora si ha a disposizione il piano generale per diverse marche e modelli. “Siamo passati dall’avere un buon progetto per una Chevy [Chevrolet, auto diffusa negli Usa, ndr], ad avere le carte progettuali di 47 auto diverse di 47 diversi produttori”.
Se immaginassimo di svolgere il filamento della molecola di DNA umano, solitamente compattata nei cromosomi del nucleo delle nostre cellule, otterremmo un filo microscopicamente sottilissimo ma lungo quasi 2 metri e fatto di circa 3 miliardi di paia di basi azotate o nucleotidi. In realtà di basi azotate ce ne sono solo quattro che si ripetono in sequenza: adenina (A), timina (T), citosina (C), guanina (G). E siccome la molecola di DNA è una doppia elica, stanno sempre in coppia una di fronte all’altra: la A con la T, la C on la G.
Idealmente, i ricercatori del consorzio Pangenoma ora hanno messo in file parallele tra loro 94 di queste sequenze ottenute da 47 individui (anche i cromosomi vanno in coppia e per ciascun individuo è stata ordinata la sequenza di uno e l’altro cromosoma delle 23 coppie che abbiamo) e le hanno confrontate.
Grazie a nuovi metodi computazionali e tecniche di sequenziamento che permettono di leggere porzioni più ampie di genoma in una sola volta (long-read sequencing), sono anche riusciti a includere 119 milioni di paia di basi che non facevano parte del genoma di riferimento del 2022.
Human pangenome supports analysis of complex genomic regions https://t.co/db9jS0eAf6
— nature (@Nature) May 11, 2023
Quello che hanno ottenuto è un grafo in cui la stragrande maggioranza delle sequenze sono condivise (shared sequences) ma in alcuni casi hanno individuato delle varianti strutturali (structural variants) ovvero variazioni sul tema della spartitura genomica che alcuni hanno e altri no: spesso si tratta di duplicazioni (intere porzioni di genoma ripetute), cancellazioni (deletions, intere porzioni di genoma assenti) o inserzioni (piccole aggiunte di lettere nella sequenza genomica).
Gli autori del lavoro riportano che utilizzando il pangenoma come riferimento, quando si confronta il patrimonio genetico di diversi individui è possibile individuare il doppio delle differenze strutturali rispetto a quando si utilizzava il singolo genoma come riferimento. “Siamo passati dalla televisione in bianco e nero a quella in alta definizione”, ha spiegato un genetista dell’università della California a san Diego, Kelou Fox.
Tali differenze costituiscono la variabilità, la diversità e la ricchezza genetica umana e stanno a indicare che esistono diversi modi possibili di svolgere lo stesso compito, sia questo stabilire il colore dei capelli o degli occhi di un individuo, o, più realisticamente, strutturare una complessa rete di interazioni molecolari che magari ricopre una funzione metabolica che ancora non abbiamo del tutto compreso.
Sebbene due persone prese da qualsiasi punto della Terra condividano più del 99% del loro genoma, quelle piccole differenze possono fare una grande differenza, in termini di comprensione di alcune malattie genetiche rare, ad esempio.
Sebbene le differenze genetiche tra individui ci siano, non sono sufficienti a categorizzare diverse popolazioni umane in razze. Questo perché la distribuzione di tali differenze è tutt’altro che uniforme e tale da individuare gruppi distinti, come ad esempio avviene nei cani, frutto inoltre di una selezione artificiale e direzionata dalle preferenze umane.
Anche il Progetto Pangenoma è tutt’altro che concluso. Ai genetisti di tutto il mondo servirà tempo per prendere confidenza con questo nuovo modo in alta definizione di confrontare genomi, ma soprattutto bisognerà arricchire ancora di più la diversità del pangenoma di riferimento. Entro metà del 2024 si punta a generarne uno fatto di sequenze di 350 individui, in modo da includere anche popolazioni solitamente sotto-rappresentate.
LEGGI ANCHE
A tal proposito però non mancano le preoccupazioni di carattere etico. Molte delle sequenze utilizzate nel lavoro appena pubblicato derivano da campioni di DNA scongelati che erano stati raccolti da 26 diverse popolazioni come parte del 1000 Genomes Project iniziato nel 2008. All’epoca i partecipanti avevano fornito il consenso a rianalizzare il proprio DNA. I ricercatori hanno assicurato che sono impegnati ad implementare nuove misure per assicurarsi che l’uso del materiale genetico sia conforme sul piano etico. Ad esempio, non verranno inclusi membri di tribù indigene le cui posizioni o i cui valori non sono compatibili con il sequenziamento del proprio DNA.
“Se la ricerca non porta beneficio a diverse comunità, stiamo facendo qualcosa di fondamentalmente sbagliato” ha dichiarato Krystal Tsosie, epidemiologo genetico e bioeticista dell’Arizona State University di Tempe e cofondatore di Native BioData Consortium, un istituto di ricerca no-profit del South Dakota, diretto da scienziati indigeni e membri di tribù di nativi.
Bilanciare l’esigenza di includere popolazioni spesso marginalizzate con il rispetto di tali principi etici sarà una delle sfide con cui si dovrà misurare il Progetto Genoma Umano.