Scienza e Ricerca

19 Marzo 2020

La scienza dietro le tecnologie che leggono le espressioni facciali

Mentre in Europa si sta discutendo, e forse ancora troppo poco, sulla liceità dell’utilizzo dei sistemi di riconoscimento facciale su larga scala, negli Stati Uniti esistono già aziende che sviluppano e vendono software specializzati nel riconoscere gli stati emotivi veicolati dalle espressioni facciali.

Affectiva a Boston o NeuroData Lab a Miami vendono i loro prodotti ad agenzie di marketing, che li utilizzano per estrarre dati che vanno a comporre il profilo psicologico degli utenti, destinatari di campagne pubblicitarie personalizzate. Gli stessi strumenti sono utilizzati anche per rintracciare l’eventuale presenza di disturbi depressivi o per valutare l’idoneità lavorativa di un candidato. La tecnologia sfruttata è quella del machine learning: un’enorme mole di dati, immagini e video, elaborata da sistemi di intelligenza artificiale che dai grandi numeri riescono a estrarre regolarità (pattern).

Anche Microsoft, Ibm, Amazon, Facebook e Google stanno investendo nella stessa direzione. Il valore del giro d’affari che orbita intorno ai dati della lettura delle espressioni facciali è stimato nell’ordine delle decine di miliardi di dollari. Il mercato dei dati d’altronde è quello più redditizio del XXI secolo se si pensa che da qualche anno i colossi del web hanno scalzato e ormai ampiamente staccato le compagnie petrolifere in vetta alla classifica delle società con maggiore capitalizzazione.


LEGGI ANCHE:


Paesi come gli Stati Uniti e ancor più la Cina stanno accogliendo entusiasticamente l’alba delle tecnologie del riconoscimento facciale. In Europa, come si è detto, è in corso un dibattito, anche se Ungheria, Grecia e Lettonia, allo scopo di identificare migranti illegali, poco più di un anno fa hanno iniziato a usare un sistema di riconoscimento facciale che dovrebbe scovare micro-espressioni di inganno sui volti di chi attraversa i confini nazionali.

Tutte le tecnologie volte a estrapolare gli stati emotivi delle persone a partire dalle loro espressioni poggiano su due assunti teorici fondamentali: che a ogni espressione corrisponda una precisa emozione (stato mentale o stato emotivo) e che le emozioni vengano comunicate con le stesse espressioni in tutto il mondo.

Questi due assunti hanno sorretto la scienza cognitiva delle espressioni facciali per decenni, a partire da uno dei suoi maggiori esponenti, Paul Ekman, psicologo statunitense, luminare della disciplina (i suoi lavori hanno ispirato anche la serie tv Lie to me). Le sue ricerche sono state compiute tra gli anni ‘60 e ‘70 del secolo scorso su adulti e bambini, abitanti di metropoli e membri di popolazioni indigene, concludendo che le espressioni facciali sono una forma di comunicazione comprensibile da tutti, a prescindere dalla regione o dalla cultura di provenienza. Sarebbero pertanto degli universali, ovvero tratti che accomunano tutti i membri della specie umana, e in quanto tali una forma di comunicazione non verbale universalmente comprensibile: rabbia, paura, felicità, piacere, tristezza, disgusto verrebbero veicolati dalla mimica facciale allo stesso modo in tutte le popolazioni del mondo.

È ragionevole del resto pensare che la capacità di comunicare a soli gesti una reazione di paura davanti a un pericolo, o una smorfia di disgusto dinanzi a del cibo avariato, abbia un valore adattativo e che dunque sia evoluta per selezione naturale. La questione se l'era posta anche Darwin, che nel 1872 aveva dato alle stampe L'espressione delle emozioni nell'uomo e negli animali.

Oggi però un gruppo di psicologi e scienziati cognitivi mette in dubbio l’universalità delle espressioni facciali, che ha fatto scuola per anni, e con essa i presupposti che reggono la validità delle tecnologie già in commercio.

La psicologa dell’università di Glasgow Rachael Jack nel 2018 ha condotto uno studio per verificare se le espressioni facciali veicolino univocamente le sensazioni che realmente l’individuo sta provando, o se invece non siano ambigue e dunque equivocabili. Lo studio si è concentrato sull'espressione di due esperienze emotive egualmente intense: il dolore e l’orgasmo. Sono stati considerati 80 partecipanti in totale, 40 provenienti da culture dell’Asia orientale e altrettanti dall’Asia occidentale.

I risultati raccolti da Jack portano a ritenere che mentre le espressioni di dolore siano simili in culture diverse, individui provenienti da regioni diverse dell’Asia hanno idee diverse su quali espressioni debbano veicolare la sensazione di piacere. Fattori precettivi dettati dalla cultura di appartenenza giocherebbero dunque un ruolo fondamentale nel modellare le rappresentazioni mentali delle espressioni facciali.

Una simile conclusione porta a ritenere che le espressioni facciali non siano quel linguaggio universale ritenuto da Ekman, ma che esista una notevole variabilità inter-culturale che non consente di associare inequivocabilmente una singola espressione facciale a un singolo stato emotivo. Lo ribadisce anche recente lavoro di review di oltre 1000 articoli scientifici sull’argomento, diretto da Lisa Feldman Barrett, psicologa di Boston della Northeastern University. In un articolo su Nature del giornalista scientifico Douglas Heaven, lo psicologo Carlos Crivelli dell’università De Montfort di Leicester in Regno Unito, commenta che tentare di stabilire uno stato mentale a partire da un’espressione facciale è come tentare di misurare la massa in metri.

La comunità degli psicologi e degli scienziati cognitivi resta però divisa. Ekman non è d’accordo con il lavoro di Barrett, che tratterebbe in modo troppo rigido il rapporto uno a uno tra espressione facciale e stato emotivo, e rilancia: dalle espressioni facciali non solo si potrebbe risalire agli stati emotivi individuali, ma addirittura ai pattern di attivazione neurofisiologica. Insieme ad Ekman molti ricercatori e ricercatrici restano convinti che un’espressione di rabbia sia riconoscibile da tutti universalmente.


LEGGI ANCHE


Paul Ekman aveva collaborato con la Transportation Security Administration degli Usa, per introdurre nel 2007 un programma (Spot - Screening Passengers by Observation Techniques), volto a insegnare al personale della TSA a riconoscere segnali di stress sui volti dei passeggeri, indicatori di potenziale sospetto, paura o inganno. L’iniziativa era già stata criticata aspramente da alcuni membri del Congresso e dall’American Civil Liberties Union. Di recente però lo stesso Ekman, come riporta Douglas Heaven su Nature, ha scritto personalmente ad alcune tra le più grandi aziende del settore chiedendo di vedere le prove scientifiche del funzionamento delle tecnologie di lettura delle espressioni facciali.

Affectiva sostiene che i suoi software, allenati su più di 7 milioni di facce di 87 Paesi diversi, hanno una precisione superiore al 90%. NeuroData Lab riconosce che esiste variazione nell’espressione delle emozioni, ma sostiene che alcune configurazioni facciali sono più comunemente associate a un dato stato emotivo.

Nonostante il dibattito nella comunità scientifica sia aperto e lontano dall’aver raggiunto una fine, aziende e governi si comportano come se dello studio delle espressioni facciali venissero solo certezze. Sono in molti tra i ricercatori a ritenere prematuro lo sviluppo di tecnologie e business basati sui dati estrapolati dalle espressioni facciali, soprattutto perché dagli errori e dai pregiudizi (bias) delle macchine possono derivare danni reali alle persone.