SCIENZA E RICERCA

Immersi nei big data, risorsa o rischio per la società?

Nel 2008 il direttore della rivista Wired, Chris Anderson, ha annunciato la morte della teoria e il trionfo dei dati: i big data rivoluzionerebbero addirittura il metodo scientifico, lo renderebbero obsoleto, in quanto non ci sarebbe più bisogno di alcun tipo di mediazione teorico-interpretativa, non ci sarebbe più bisogno di “leggere” i dati in un certo modo anziché in un altro; i dati sono talmente tanti (un diluvio) che raccontano direttamente la realtà per quello che è. Da qui la morte della teoria, dell'interpretazione.

Sono passati 10 anni da quell'editoriale di Chris Anderson e ciò che osserviamo oggi è la realizzazione di quella che potremmo definire la nemesi di quella profezia: viviamo nell'era della post-verità, delle fake news, il cui motto è “non esistono fatti, solo interpretazioni”, celebre provocazione del Friedrich Nietzsche dei Frammenti Postumi (1885 – 1887) e dello scritto giovanile Su verità e menzogna in senso extramorale.

I big data non hanno affatto messo in soffitta il metodo scientifico, che si basa sulla formulazione di ipotesi a partire da osservazioni e sulla costruzione di teorie che vengono confermate o falsificate dalle evidenze empiriche. I dati fanno parte del processo di costruzione della conoscenza scientifica, e i big data sono una risorsa aggiuntiva che certi scienziati possono sfruttare, senza però stravolgere il loro mestiere.

Sabina Leonelli, professoressa di filosofia e storia della scienza all'università di Exeter, dal 2014 è principal investigator di un progetto Erc, Data_Science, grazie al quale si occupa proprio di capire come i big data si inseriscono nella pratica e nella metodologia scientifica, e come vengono utilizzati per modificare il rapporto tra tecnoscienza e società.

Una parte del suo progetto si occupa proprio di seguire il tragitto che i dati percorrono, dalla loro generazione al loro utilizzo, passando per tutti gli stadi intermedi di analisi e rielaborazione. Sabina Leonelli si è occupata di un insieme eterogeneo di dati, dominio di diverse discipline, come le scienze botaniche, le scienze biomediche, la fisica delle particelle, le scienze climatiche, le scienze ambientali, l'archeologia e l'economia.

Quello che ha trovato è che i dati sono molti, ma rappresentano sempre una piccola fetta dell'intera torta; ed è proprio scambiando la parte per il tutto che spesso si generano distorsioni.

Sabina Leonelli, università di Exeter, ha vinto un finanziamento Erc per studiare come i big data impattano sulla ricerca scientifica

“Esiste questa idea secondo cui i big data stanno rivoluzionando il mondo, grazie a tutte queste fantastiche tecnologie sappiamo tutto di tutto e quindi non c'è più bisogno di pensare a quali sono le fonti della nostra conoscenza perché conosciamo tutto. Dal punto di vista empirico del mio lavoro ho proprio dimostrato che questo non è vero, che infatti le fonti di dati che vengono fatte circolare, a cui la gente e i ricercatori hanno accesso, sono molto limitate e assolutamente non rappresentano tutto quello che c'è nel mondo, ne rappresentano sempre una piccola parte, che è selezionata su criteri che molto spesso hanno a che fare più con chi finanzia questa produzione di dati e col tipo di conoscenza che se ne vuole prendere”.

Per quanto riguarda l'affermazione di Chris Anderson, Sabina Leonelli ha le idee molto chiaro: “Un motivo per cui non sono d'accordo con l'affermazione di partenza è un motivo filosofico che ha le sue radici in 2000 anni e più di filosofia: tutti i grandi filosofi hanno sempre riconosciuto che non si possono avere dati grezzi, dati che ci danno informazioni sul mondo che non siano già mediate. Tutti gli oggetti che usiamo nella ricerca scientifica e nella vita quotidiana per acquisire informazioni dal mondo, sono elementi di mediazione tra noi e il mondo, a cui diamo un certo tipo di valore, e molto spesso nella scienza questo vuol dire anche un valore teorico, concettuale. Quando un ricercatore produce dati lo fa attraverso strumentazione, attraverso apparati particolari, che sono tutti costruiti sulla base di principi teorici molto precisi che ritengono in se stessi una traccia di tutte queste particolari prospettive. Quindi tutti i dati provengono da un certo tipo di prospettiva concettuale e anche il modo in cui vengono organizzati spesso è basato su teorie, su aspettative di come uno potrebbe usarli. Questa idea della morte della teoria nella scienza dei dati è assolutamente sbagliata perché troviamo teoria a tutti i livelli, a livello di cosa sono i dati, di come vengono prodotti, a livello di come vengono mobilizzati, come vengono classificati e anche a livelli di come vengono usati e interpretati”.

© 2018 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012