SCIENZA E RICERCA
Possiamo imparare qualcosa sul cervello grazie alle reti neurali?
Negli ultimi anni abbiamo imparato moltissimo sul cervello e sul suo funzionamento, eppure ciò che sappiamo è solo una piccola parte di quello che non è ancora chiaro. Per esempio, sappiamo che alcuni neuroni hanno la capacità di rispondere in modo preferenziale a specifici stimoli o caratteristiche dell'ambiente (selettività dei neuroni): ogni neurone può essere "selettivo" rispetto a una particolare informazione, come un colore specifico, una frequenza sonora o una certa configurazione, eppure rimane difficile capire esattamente quale ruolo funzionale abbiano queste selettività, non è chiaro se tutte le proprietà scoperte siano essenziali per il funzionamento del cervello o se alcune siano solo un fenomeno secondario, non direttamente rilevante per il comportamento adattivo. Il problema è che, a parte pochi casi ben studiati, come i recettori della retina, non si sa ancora con precisione come le varie selettività dei neuroni contribuiscano alla percezione, alla cognizione e al comportamento.
Per avvicinarsi a una comprensione più profonda, un gruppo di ricercatori ha proposto su Pnas un approccio molto particolare: e se invece di ispirarsi al cervello biologico per creare le reti neurali, come è stato fatto per un certo tempo, ci affidassimo a sistemi artificiali per comprendere meglio come funziona il cervello? L'articolo va a indagare il fenomeno della convergenza evolutiva tra sistemi biologici del cervello umano e sistemi artificiali come le reti neurali. Nonostante le differenze tra il cervello e le reti artificiali, le somiglianze che secondo i ricercatori emergerebbero tra questi sistemi potrebbero rivelarsi utili per comprendere il ruolo funzionale dei neuroni.
Prima di entrare nel merito, precisiamo che l’articolo è un cosiddetto commentary, una sorta di editoriale scientifico in cui si costruisce una riflessione su un argomento già studiato. Il suo scopo è proporre nuovi punti di vista o commentare l’impatto delle scoperte più recenti, in modo da stimolare il dibattito tra gli addetti ai lavori. Non è quindi un articolo che presenta nuove ricerche o risultati sperimentali e che è valutato ed eventualmente pubblicato previa peer review.
La riflessione dell’articolo parte dal concetto di convergenza evolutiva, ben noto in biologia: si verifica quando specie lontane sviluppano indipendentemente caratteristiche analoghe per adattarsi all'ambiente. Un esempio classico è la convergenza delle ali in uccelli, pipistrelli e insetti. L'articolo estende questo concetto ai sistemi ingegnerizzati, sostenendo che la convergenza tra cervelli biologici e sistemi artificiali potrebbe segnalare alcune proprietà funzionali dei primi. Secondo Marco Zorzi, docente di psicologia cognitiva e intelligenza artificiale all’università di Padova, però, il termine è fuorviante: “Nelle reti neurali artificiali – ci spiega – “non esiste un processo di evoluzione come in biologia. Nelle reti c’è piuttosto un apprendimento, un processo attraverso cui la rete viene addestrata a riconoscere schemi o a risolvere problemi specifici, migliorando progressivamente le proprie prestazioni. Può esserci una somiglianza con i sistemi biologici, ma i cambiamenti non si presentano per caso, come succede nell’evoluzione, sono dovuti agli algoritmi di apprendimento. In alternativa si può pensare ai miglioramenti nelle architetture delle reti e negli algoritmi di apprendimento, ma questi non vanno necessariamente nella direzione di maggiore convergenza con i sistemi biologici"
“ Nelle reti neurali artificiali –non esiste un processo di evoluzione come in biologia Marco Zorzi
Il paragone tra l'evoluzione biologica e quella tecnologica è quindi un po’ tirato: l'evoluzione tecnologica avviene spesso attraverso tentativi ed errori, con soluzioni più adatte che vengono selezionate attraverso un processo di eliminazione non casuale delle tecnologie meno performanti. Nel caso dell’evoluzione, cambiamenti casuali che rendono l’animale più adatto all’ambiente vengono tramandati ai discendenti perché essere più adatti dà maggiori probabilità di riprodursi e trasmettere quindi i propri geni.
I ricercatori fanno poi l'esempio delle reti neurali convoluzionali (CNN): sviluppate inizialmente per il riconoscimento delle immagini, le CNN hanno raggiunto e superato le capacità umane in questo campo grazie all'aumento del numero di strati, neuroni e connessioni. Ma torniamo di nuovo al punto principale, ovvero la lontananza dei nuovi modelli dal punto di partenza biologico: “L’IA contemporanea – spiega Zorzi - si sta sviluppando in una direzione divergente rispetto alle neuroscienze perché è orientata ad ottenere prestazioni sempre superiori. L’approccio ingegneristico porta le reti artificiali più lontano dai modelli del cervello reale, per questo i ricercatori che si occupano di neuroscienze computazionali utilizzano reti più semplici e vincolate alle conoscenze sul sistema visivo nel cervello dei primati”.
L’articolo si concentra poi sulla codifica relazionale, un tipo di rappresentazione usata dal cervello (e in alcuni modelli di reti neurali) in cui l’informazione non è rappresentata dai singoli neuroni, ma dalle relazioni tra i pattern di attivazione di gruppi di neuroni.
Immaginiamo di avere diversi oggetti (ad esempio, un cane, un gatto e una mela) e un gruppo di neuroni che rispondono in modo diverso a ciascuno di essi. Ogni volta che il cervello percepisce uno di questi oggetti, un pattern di attivazione unico si manifesta tra i neuroni (una sorta di "impronta" che quel particolare oggetto lascia nel sistema nervoso). La codifica relazionale usa le somiglianze e le differenze tra questi pattern di attivazione per identificare le relazioni tra gli stimoli. Per esempio i pattern di attivazione per il cane e il gatto saranno più simili tra loro rispetto a quello della mela, perché emergono le somiglianze visive tra i due animali.
Questo tipo di codifica permette al cervello di organizzare le informazioni non solo su base individuale (come una risposta per ogni stimolo), ma anche a livello di categorie e somiglianze tra stimoli.
In questo modo, il cervello riesce a identificare categorie più generali (ad esempio, tutti i volti hanno una struttura simile, come scriviamo nel primo articolo linkato) e a rispondere in modo adeguato agli stimoli appartenenti alla stessa categoria.
Gli autori dell’articolo parlano della codifica relazionale come un esempio di convergenza tra cervello e reti neurali artificiali, sostenendo che in entrambi i sistemi si sviluppano pattern simili di rappresentazione. Questa somiglianza è per loro interessante perché potrebbe indicare un principio funzionale comune che emerge sia nei sistemi biologici sia in quelli artificiali. Gli autori citano l'RSA (Representational Similarity Analysis) per spiegare la codifica relazionale e confrontare pattern tra cervello e reti neurali. Zorzi riconosce il valore di RSA per confrontare dati di tipo diverso (ad esempio, i pattern di attivazione cerebrale e quelli delle reti neurali), ma anche in questo caso non è vero che i sistemi sviluppati con obiettivi puramente ingegneristici, e quindi dell’evoluzione tecnologica dell’IA, mostrino maggiore parallelismo con i dati neuroscientifici.
“La codifica relazionale – spiega Zorzi –si osserva anche in reti artificiali con architetture molto diverse tra loro. I pattern di attivazione simili emergono perché le reti neurali catturano le regolarità presenti nei dati usati per l’addestramento e le codificano in un modo che preserva la similarità tra stimoli, una nozione che risale agli anni 80 del secolo scorso.”.
Per Zorzi, RSA è solo un metodo per quantificare la somiglianza tra rappresentazioni dei dati nel cervello e in una (specifica) rete neurale. Le reti sviluppano una codifica relazionale perché i dati di addestramento le spingono a categorizzare e distinguere gli stimoli in base a somiglianze statistiche. Si tratta quindi di una somiglianza di superficie, che non riflette necessariamente una vera analogia nei meccanismi sottostanti.
L'articolo propone anche un parallelo tra le grid cell (cellule a griglia) dell'area entorinale e la compressione JPEG. Queste cellule sono coinvolte nella navigazione e nella memoria spaziale: quando ci muoviamo in un ambiente, queste cellule si attivano in posizioni precise, creando un pattern di attivazione che forma una griglia. Questo schema organizzato è utile per rappresentare la posizione nello spazio e per mappare l’ambiente in modo efficiente, riducendo la necessità di codificare ogni singolo dettaglio spaziale. Secondo gli autori, la funzione delle cellule a griglia può essere paragonata a quella delle funzioni di base utilizzate nella compressione JPEG, perché entrambe comprimono l’informazione per facilitarne l’elaborazione. Nella compressione delle immagini (ad esempio JPEG), un'immagine è rappresentata utilizzando solo le informazioni più significative per ridurre la quantità di dati, mantenendo però abbastanza informazioni per ricostruirla con una qualità accettabile.
Zorzi però è scettico: “Non ho capito il senso di questa analogia. La funzione di compressione delle informazioni, come quella spaziale per le cellule a griglia, è nota da tempo e ben documentata. Questo paragone non aggiunge nulla di nuovo e sembra ignorare studi più solidi che hanno già dimostrato come questi meccanismi emergano in reti neurali addestrate per compiti di navigazione spaziale, senza bisogno di riferirsi a meccanismi di compressione simili al JPEG”.
La valutazione critica di Zorzi ci invita a riflettere sui limiti dei modelli artificiali come strumenti per comprendere il cervello, ricordando l’importanza dell’apprendimento come fattore che influenza le somiglianze osservate tra i due sistemi: ci sono ancora molti passi da fare per capire come funziona il cervello biologico, ma paragonarlo a qualcosa di artificiale può portarci fuori strada se il suo sviluppo è guidato da scopi ingegneristici.