SCIENZA E RICERCA
Tecnologia e scienze sociali, il legame nascosto
Correva l’anno 1940 quando Paul Lazarsfeld, fondatore della moderna sociologia empirica, si chiedeva: “chi parla a chi, di cosa, e con quale effetto?” e in questo quesito sembra di sintetizzare il meccanismo dei contemporanei social network. A citarlo è Prabhakar Raghavan, vicepresidente del settore Strategic Technologies di Google (già IBM e Yahoo), nella sua conferenza al dipartimento di Ingegneria dell’informazione dell’università di Padova.
Raghavan spiega che la frontiera delle scienze computazionali, di cui si occupa, è proprio quella di riuscire a misurare, in termini rigorosi, gli aspetti sociologici dell’utilizzo dei social network. Apre infatti la conferenza con una provocazione: la gran parte dei cicli numerici non sono utilizzati dagli specialisti per risolvere problemi computazionali, dice, ma dagli utenti ordinari per comunicare e non ha quindi senso chiedersi cosa possa essere calcolato numericamente, ma cosa l’utente ordinario del web vorrebbe che lo fosse.
E così gli esperti di informatica, come Raghavan stesso, ,si trovano ad affrontare un cambio di prospettiva: le scienze computazionali devono mettersi al servizio delle scienze sociali proprio per meglio lavorare nel campo della tecnologia e, conseguentemente, devono trovare il modo di dialogare con esse. Se, per esempio, la microeconomia si esprime esattamente con lo stesso linguaggio dell’informatica (la matematica) e con le stesse metodologie (modelli, teoremi, equazioni di equilibrio) lo stesso non si può dire per le scienze sociali. Queste ultime, infatti, lavorano su piccola scala, con un approccio alla ricerca di tipo “qualitativo”, (le cosiddette “interviste in profondità, i focus group, dove il campione di intervistati è ridotto ma rappresentativo), raggiungendo una comprensione profonda dei fenomeni. Invece la rete offre ai computisti un osservatorio molto grande, ma un grado di comprensione dei comportamenti registrati decisamente scarso.
L’operazione cardine per interfacciare le due discipline sta nel mettere in relazione l’aspetto sintattico tipico della matematica e delle scienze affini (individuazione di proprietà, tracciabilità di grafici, formulazione di modelli generativi: in sostanza,la misurabilità) con l’aspetto semantico delle scienze sociali, espresso dal linguaggio esteso del tipo cui faceva riferimento Lazarsfeld (“chi influenza chi?” e simili).
Bisogna tener presente che i social network, rappresentazione prima di un linguaggio di tipo semantico, possiedono delle proprietà sintattiche, come il grado di distribuzione (ossia la funzione di distribuzione delle scelte), il diametro (la distanza che intercorre tra i vari elementi del network) e la compressibilità (la possibilità di ridurre gli elementi, ad esempio le possibili scelte, per non incorrere in ripetizioni) su cui sono già stati fatti degli studi. In particolare, per quanto riguarda il diametro, è stato osservato che i famosi “sei gradi di separazione”, che fan sì che chiunque possa raggiungere la conoscenza di chiunque altro passando per sei contatti a catena, nell’era di Facebook si sono ridotti a 4.74 (Backstrom et al., 2012), mentre è stato dimostrato che la compressibilità dei social network è molto elevata, a testimoniare il fatto che il comportamento umano non è casuale (tutti ci comportiamo sostanzialmente nello stesso modo).
Per quanto riguarda il grado di distribuzione, poi, esaminando una rete qualsiasi (Facebook, Twitter, una mailing list) per sottoinsiemi estremamente interconnessi, emerge sempre la presenza di un focus e di una gerarchia; inoltre si rileva che esistono leggi matematiche in grado di descrivere quella che Chris Andersen ha chiamato la “coda lunga” di una distribuzione statistica che descrive il comportamento umano. Non è possibile, spiega Raghavan, neppure per gli informatici computisti, trascurare la quantità di informazione presente nella coda della distribuzione probabilistica discendente che è rappresentativa del meccanismo di scelta, perché la completezza della visione sta proprio nel prendere in considerazione anche le scelte stravaganti, i prodotti ad personam, le informazione caratteristiche delle minoranze.
Ecco quindi che gli informatici che vogliono relazionarsi con le scienze sociali ne tengono in conto, come non dimenticano mai l’insegnamento di James Surowiecki, che in The wisdom of crowds (2004) ha dimostrato in via sperimentale che un gruppo di persone comuni può fare previsioni migliori di quelle di un esperto, individuando poi le condizioni e le regole sottostanti a questo fenomeno.
Detto ciò, come fare operativamente a trasformare un dato semantico in uno sintattico, ossia misurabile? Raghavan spiega la ricetta, che è sempre la stessa, opportunamente applicata: l’espressione semantica va suddivisa in sottoproblemi, ciascuno va affrontato utilizzando un approccio testato e poi i risultati vanno ricomposti, talvolta affidandosi ad un’intuizione che può sembrare, quantomeno inizialmente, simile ad un atto di fede. La parte difficile di tutto il processo è la possibilità di eseguire esperimenti ripetibili (come richiede il metodo scientifico), di non influenzare il campione da testare (si tratta pur sempre di persone e non di elementi fisici o matematici) ma soprattutto di valutare i principi individuati in stato stazionario: come misurare, infatti, uno stato stazionario se siamo sempre in perenne stato transitorio?
Quest’ultimo quesito, seppure formulato in linguaggio scientifico, rappresenta un problema dal forte carattere semantico, noto sin dai tempi del panta rei di Eraclito. Solo che la velocità con cui tutto scorre è decisamente aumentata negli ultimi decenni e nessuno può dire, nemmeno Raghavan cui è stata posta la domanda, dove andremo a finire. Forse varrebbe la pena fare un sondaggio su Facebook o aprire una discussione su Twitter.
Valentina Berengo