SCIENZA E RICERCA

La genomica sociale a 20 anni dalla mappatura del genoma umano

20 anni fa, nel febbraio del 2001, venivano resi pubblici i primi dati sulla mappatura del genoma umano. Fu un’impresa scientifica epocale, l’equivalente biologico dello sbarco sulla luna, e fece capire come il XXI sarebbe stato il secolo della biologia. Oggi le scienze del genoma si sono sviluppate a tal punto che nei geni non si cercano soltanto i fattori di rischio di una malattia, ma addirittura la probabilità di abbandonare precocemente la scuola. La genomica sociale è strumento poderoso, che però va usato responsabilmente, pena la generazione di pesanti disuguaglianze. Ma andiamo con ordine.

La conquista dell’intera sequenza del DNA umano non ha rappresentato soltanto un risultato scientifico eccezionale, ha anche cambiato il modo di fare scienza. Ha inaugurato per esempio l’era della rapida condivisione di dati genetici accessibili, la cui importanza è lampante oggi che ci troviamo di fronte a un virus pandemico sconosciuto fino a poco più di un anno fa. Il primo genoma virale fu reso disponibile i primi giorni di gennaio 2020 da un gruppo di ricercatori cinesi che lo aveva sequenziato. Oggi, sulla piattaforma GISAID abbiamo a disposizione più di 450.000 sequenze che hanno consentito di costruire vaccini in tempi record e di adattarli alle nuove varianti.

Grazie ai dati genomici enormi passi avanti sono stati fatti in medicina: sono state comprese le basi genetiche di diverse malattie rare e dei fattori di rischio di malattie complesse come quelle cardiovascolari o i tumori.

Le razze umane sono state definitivamente destituite di qualsiasi valore scientifico: la diversità genetica umana è distribuita come in un arcobaleno di colori che sfumano l’uno nell’altro senza poter identificare un netto punto di stacco. Allo stesso tempo le differenze a livello individuale, che esistono, sono state meglio comprese e un’intera nuova branca si è sviluppata: la medicina personalizzata (o di precisione) che è in grado di calibrare i trattamenti sulle caratteristiche genetiche individuali.

Dopo due decenni tuttavia esiste ancora uno sbilanciamento a favore dei Paesi benestanti. Affinché i database genomici siano davvero rappresentativi del patrimonio genetico umano devono essere integrati con dati di popolazioni sotto-rappresentate, come quella africana e quelle indigene.

La corsa alla mappatura del genoma umano ha anche accelerato l’integrazione dell’informatica nella biologia. Nel 2000 è stato creato il primo software per dati genomici, GigAssembler, e da lì in poi i metodi di analisi dei big data, e i nuovi algoritmi per leggerli, sono andati progressivamente aumentando e raffinandosi, fino a mescolarsi con i metodi computazionali di intelligenza artificiale.

I costi di applicazione tecnologica si sono abbassati drasticamente e un’intera industria privata si è sviluppata: l’azienda statunitense 23AndMe ad esempio a partire da un campione di saliva è in grado di dire a un individuo quanto è il suo rischio di sviluppare malattie cardiovascolari, tumori o disturbi neuro-degenerativi.

Nel 2007 solo 2 persone si erano fatte sequenziare interamente il proprio genoma: Craig Venter, che nel mappare il genoma umano con la sua Celera Genomics nel 2001 batté sul tempo il progetto finanziato dal governo statunitense (lo Human Genome Project), e James Watson, lo scopritore della molecola del DNA nel 1953.

Per conoscere le basi genetiche di un tratto occorre associare i dati genomici a quelli fenotipici, ovvero informazioni sensibili quali abitudini o profili sanitari personali. I problemi legati alla privacy non mancano e vanno adeguatamente discussi e affrontati se la genomica non vuole tradursi nell’ultimo distopico strumento a disposizione del capitalismo della sorveglianza.

 

Correlazioni tra geni e comportamenti

Negli ultimi anni sono andati crescendo gli studi che hanno indagato le basi genetiche di tratti complessi, come l’omosessualità, o tratti comportamentali come l’aggressività, la tendenza a bere o a fumare. Ciò non significa che sono stati trovati i geni dell’omosessualità, come talvolta è stato sostenuto, o i geni dell’aggressività, della tendenza al fumo o al bere.

Non c’è un filo rosso continuo tra i geni che vengono trovati e il comportamento che si vuole studiare, o per lo meno non lo conosciamo. I geni non innescano dei meccanismi biologici e metabolici che portano direttamente ad accendersi la sigaretta o a riempirsi il bicchiere. La rete di interazioni tra geni e comportamento è molto più complessa di così e coinvolge anche e soprattutto gli stimoli che provengono dall’ambiente esterno. Gli studi genomici quindi si limitano a stabilire che chi fuma o beve tende ad avere un pacchetto di caratteristiche genetiche riconoscibili. In questi casi si parla di correlazione o associazione. Questi geni non causano il tabagismo ma correlano con il tabagismo. Correlation is not causation si dice in inglese.

Gli studi genomici quindi ci danno un’informazione di correlazione. Cosa ne facciamo poi di quest’informazione è un altro paio di maniche.

GWAS e punteggi poligenici

Gli studi di associazione sull’intero genoma (Genome-wide association studies – GWAS) mettono a confronto genomi di individui accomunati da caratteristiche simili con quelli di individui che non presentano quelle caratteristiche. Identificano quindi quali lettere del DNA variano tra i due gruppi (polimorfismi a singolo nucleotide – SNP) e quali varianti (pacchetti di SNP) sono più comuni tra gli individui portatori del tratto sotto esame. In tal modo si riesce ad avere un quadro di quale possa essere il contributo che la genetica dà alla comparsa di un tratto. La misura di questo contributo prende il nome di punteggio poligenico (Polygenic score).

I GWAS sono stati usati principalmente per comprendere le basi genetiche delle malattie: in questi casi si parla di punteggio di rischio poligenico (Polygenic risk score) che serve a misurare quali e quanti sono i fattori genetici di rischio di sviluppare una data malattia.

Alcuni ritengono che i punteggi poligenici possano diventare uno strumento rivoluzionario per la medicina genomica, tuttavia non è ancora chiaro quanto questi siano precisi e affidabili e il dibattito rimane aperto.

Più di recente gli stessi metodi sono stati applicati anche a tratti di interesse psicologico e sociale. In questi casi si parla di genomica sociale. I nostri comportamenti sono tratti estremamente complessi, nel senso che sono in gran parte il risultato di influenze ambientali, abitudini e stili di vita e solo in parte sono determinati dalle caratteristiche imposte dai geni. L’obiettivo degli studi genomici sul comportamento è allora quello di districare il contributo della biologia da quello della cultura.

La genetica dei livelli di istruzione

Il Social Science Genetic Association Consortium (SSGAC) è un gruppo internazionale di ricerca che tiene insieme ricercatori dell’area biomedica e gentica con quelli delle scienze sociali. Per la prima volta nel 2013 hanno applicato i metodi di GWAS ai livelli di istruzione, definiti come anni trascorsi a scuola. In quell’occasione avevano trovato che tre sole mutazioni (3 SNPs) rendevano conto del 2% della variazione nei livelli di istruzione osservati tra più di 125.000 individui considerati. I geni coinvolti avevano a che fare, secondo gli autori dello studio pubblicato su Science, con tratti cognitivi, cerebrali e legati alla salute.

Nel 2018 però, in uno studio pubblicato su Nature Genetics, la platea è stata allargata a oltre 1,1 milione di individui, trovando che 1200 SNPs potevano essere considerati responsabili di circa il 12% della variazione osservata nei livelli di istruzione. Un simile valore veniva considerato dagli autori equivalente a quanto lo stato socio-economico dei genitori può influire sul livello di istruzione che un individuo raggiunge nel corso della propria vita.

Uno studio del 2019 pubblicato su Nature Human Behavior ha indagato poi come i livelli di istruzione variassero di regione in regione, nel Regno Unito. Sono stati presi in considerazione i dati immagazzinati nella UK BioBank, che oltre ai dati genetici conserva campioni di sangue e di cellule di oltre 450.000 individui, per i quali sono disponibili anche informazioni medico-sanitarie. Il lavoro si è concentrato sulle basi genetiche di 33 tratti collegati a comportamento e salute. A ciascuno è stato assegnato un punteggio poligenico.

Alcuni tratti, come il consumo di caffeina, non mostravano differenze significative da una regione a un’altra. Ma per altri come il livello di istruzione la differenza c’era eccome: coloro che vivevano nei pressi di quelle che erano state miniere di carbone, in media, presentavano meno varianti genetiche correlate a una maggiore permanenza a scuola o a un raggiungimento di alti livelli di istruzione.

Limiti e vantaggi della genomica sociale

In un commento apparso su Nature, Abdel Abdellaoui, primo autore del lavoro, ha dichiarato che ciò che il suo gruppo ha ottenuto deve essere considerato una descrizione più che una spiegazione di come stanno le cose: “ci sono tutta una serie di variabili che si concentrano nelle aree economicamente più svantaggiate, ma è molto difficile dire qualcosa a proposito della direzione della freccia causale”.

Infatti non è affatto lecito sostenere che la genetica sia la causa dei bassi livelli di istruzione registrati in certe regioni. Una spiegazione alternativa può essere infatti che coloro che ottengono un livello di istruzione più alto, indipendentemente dalle predisposizioni genetiche (che influiscono solo in una data percentuale sul livello di istruzione che un individuo raggiungerà), migrino in aree più ricche del Paese. Se questo processo si ripete per generazioni, le disuguaglianze sociali già esistenti in una regione si rafforzano e finiscono per trovare un riscontro osservazionale persino a livello biologico.

Occorre essere chiari su questo punto. Gli studi genomici su tratti di interesse sociale, cognitivo o psicologico, ad oggi andrebbero considerati alla stregua di sondaggi più che vere e proprie spiegazioni scientifiche di un fenomeno. Descrizioni appunto, non spiegazioni.

Ad esempio i GWAS sono stati applicati anche alle tendenze di voto del referendum sulla Brexit ed è stato trovato che coloro che vivono vicino alle ex miniere di carbone oltre ad avere varianti genetiche correlate a uno status socio-economico più basso risultavano anche più propensi a lasciare l’Unione Europea. Ma questo non significa, ribadisce Abdellaoui, che qualcuno è geneticamente predisposto a votare in un certo modo. Sostenerlo avrebbe la stessa valenza di dire che esiste un rapporto di causa-effetto tra avere i capelli rossi e votare il partito comunista.

Nonostante tutte le cautele del caso, chi si occupa di intrecciare la genetica e le scienze sociali è perfettamente consapevole che sul proprio campo aleggia lo spettro dell’eugenetica.

A livello di senso comune infatti facciamo molta fatica a convincerci che i geni non determinano il comportamento. Tuttavia, tra i meccanismi che alimentano questo equivoco, una fetta di responsabilità va assegnata agli scienziati stessi che non esitano a definire predittivo il punteggio poligenico, sia esso applicato ai tratti di interesse medico o comportamentale.

Gli studi genomici sul comportamento sono uno strumento che verrà affinato mano a mano che aumenteranno i dati accumulati. Così come avviene per l’Intelligenza Artificiale, meno dati si hanno più impreciso è lo strumento, più dati si accumulano maggiore diventa la sua precisione. E proprio come per l’IA, è l’uso che sceglieremo di farne che determinerà i danni o i benefici per la società.

Per quanto riguarda gli studi genomici sui livelli di istruzione ad esempio il rischio maggiore è forse quello di interpretare i risultati nei termini di geni buoni o cattivi, superiori o inferiori. Sarebbe senza mezzi termini una forzatura irresponsabile che porterebbe a discriminazioni basate non solo sull’etnia ma addirittura sul livello socio-economico di appartenenza.

Ma è possibile anche immaginare un uso benefico dei dati genetici del comportamento. Ad esempio si può pensare di individuare precocemente bambini che hanno bisogno di una maggiore attenzione nel processo di apprendimento. Oppure si possono usare i dati raccolti per isolare la componente genetica e concentrarsi su quei tratti che possono venire modellati dall’educazione.

Gli stessi geni poi si esprimono in modo diverso in circostanze diverse. La genetica può quindi venire sfruttata per comprendere quali ambienti di apprendimento danno risultati migliori.

C’è da scommettere che la genomica applicata non solo alla medicina ma anche alle scienze sociali vivrà anni d’oro nel secolo dei dati e della biologia inaugurato dalla mappatura del genoma umano 20 anni fa. Le sfide che reca con sé sono molte e vanno affrontate con attenzione.

© 2018 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012