SCIENZA E RICERCA

Vero o falso? L’algoritmo che verifica le immagini su internet

I social network non sono solo un modo per intrattenere relazioni, ma anche una formidabile miniera di informazioni e di notizie. Lo sanno bene i giornalisti e gli operatori della comunicazione: oggi piattaforme come Facebook, Twitter, Instagram e Youtube forniscono un aiuto determinante sia per capire cosa sta accadendo, sia per trovare l’immagine o il filmato giusto per il giornale o per la propria pagina web. All’inizio si trattava soprattutto di gossip, oggi il fenomeno è sempre più diffuso: dal disastro naturale alle primavere arabe, monitorare la Rete può dare la sensazione di avere notizie e immagini fresche, direttamente da chi si trova sul posto. A costo zero, per di più.

C’è un problema: molte di quelle informazioni, in particolare quelle più veloci e virali nel diffondersi, sono semplicemente false: delle bufale, in inglese fake. Come mettersi allora al riparo dalla cantonate? Proprio la verifica delle informazioni in Rete è l’oggetto dello studio di un gruppo di ricercatori indiani dell’Indraprastha Institute of Information Technology di Nuova Dehli, degli IBM Research Labs e dell’Università del Maryland. Il campo scelto è stato quello delle fotografie diffuse su Twitter durante l’uragano Sandy: la “supertempesta” che nel 2012 ha ucciso più di 100 persone solo negli Stati Uniti. Quali di quelle centinaia di  immagini, riprese da diversi organi di informazione, erano realmente attendibili? Gli squali hanno davvero nuotato a Manhattan tra i grattacieli?

La ricerca, riassunta in maniera completa e divulgativa dal sito del Poynter Institute in Florida, ha preso come riferimento 622.860 tweet e retweet contenenti le parole “Sandy” e “hurricane” in un dato periodo, scoprendo alcune cose interessanti. Di questi messaggi più di 10.300 rimandavano a immagini false (fotomontaggi, o addirittura riprese da luoghi diversi o da film), contro appena 5.800 immagini originali. Dei messaggi contenenti fotografie fake, l’86% (circa 9.000)  era costituito da retweet. Un elemento che è balzato all’occhio degli scienziati è stato la facilità con cui le informazioni si sono diffuse anche al di fuori della cerchia di relazioni di ciascun utente, grazie all’utilizzo degli hashtag: una delle caratteristiche principali di Twitter, poi copiata anche dagli altri social network.

Un altro dato interessante è che la maggioranza dei retweet con contenuti fake era riconducibile ad appena 30 utenti. “Retweet are not endorsement”: quante volte lo abbiamo letto sui profili personali, magari assieme ad altre frasi come “Le opinioni espresse sono strettamente personali”? Eppure, in un mondo in cui tutti riceviamo (e talvolta produciamo) una mole sempre più impressionante di informazioni, bisognerebbe porre maggiore attenzione alle notizie che contribuiamo a diffondere.

Del resto quello della diffusione delle informazioni false è un problema nato praticamente con internet. Varie le tipologie, come ad esempio le catene di Sant’Antonio, le leggende metropolitane e le false raccolte di fondi, che a volte sfruttano cinicamente sofferenze e malattie reali. La maggior parte di questi imbrogli erano nati molto prima, ma dalla rapidità e dalla “viralità” della comunicazione via internet hanno ricevuto nuova linfa. Sulla Rete è spesso difficile distinguere il vero dal falso, l’autorevolezza dalla millanteria, e questo ne ha fatto anche il santuario di tutti i complottismi e delle varie teorie della cospirazione. Oggi, però, è anche più facile verificare e quello dei “cacciatori di bufale” è diventato un vero e proprio genere giornalistico e comunicativo, con serie televisive come Mythbusters e numerosi blog come quello, in italiano, di Paolo Attivissimo.

Lavorando sulla verifica delle informazioni, gli autori dello studio citato hanno sperimentato un sistema che dovrebbe riuscire a trovare automaticamente le immagini false. Il segreto sta in un algoritmo denominato Decision tree. Il sistema esaminerebbe una serie di parametri, divisi in due gruppi: da una parte le caratteristiche dell’utente (numero dei follower, presenza di un sito e di un’identità certificata...), dall’altra quelle intrinseche a ogni singolo messaggio, come la lunghezza e la presenza di punti esclamativi, caratteri maiuscoli, emoticon, url o citazioni di altri utenti. Il risultato è un sistema che riuscirebbe a trovare le immagini false con una precisione per ora pari del 97%.

La notizia ovviamente sta destando molto interesse nella Rete, sia tra gli specialisti del settore che tra gli stessi gestori dei social network, interessati a sviluppare applicazioni che aiutino gli utenti a raccapezzarsi nel costante flusso di messaggi. Alla fine però vale sempre la regola, buona non solo per i giornali, di non diffondere notizie che non si possono verificare direttamente, o che vengono da fonti non verificabili.

D.M.D.

© 2025 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012