SOCIETÀ

Lingue africane e AI: voci per l’inclusione

Novemila ore di contenuti audio registrati in Sudafrica, Nigeria e Kenya sono stati trascritti, revisionati e infine sottoposti a controlli per garantirne l'accuratezza: si tratta di un ampio e recente progetto che coinvolge diverse lingue native, tra cui isiZulu e tshivenda in Sudafrica, hausa e yoruba in Nigeria e kikuyu e dholuo in Kenya. Dunque, partendo dal modo in cui le persone parlano davvero, nella vita reale, in Africa, in contesti legati all’agricoltura, alla sanità e all'istruzione, è stato costruito ed è in lavorazione un dataset a libero accesso che punta ad affrontare e superare la sottorappresentazione delle lingue africane nei grandi modelli linguistici (LLM) di intelligenza artificiale (legata soprattutto alla mancanza di investimenti e di dati facilmente reperibili) per accelerare l’inclusione, l'innovazione e favorire gli sforzi condivisi verso una vera uguaglianza digitale. 

"Per l’Africa, l’AI ha il potenziale di influenzare in modo significativo il raggiungimento delle aspirazioni dell’Agenda 2063 e degli Obiettivi di sviluppo sostenibile. È considerata una forza trainante per il cambiamento positivo, la trasformazione socio-economica e la rinascita culturale", si legge nella Strategia continentale per l'intelligenza artificiale (Continental Artificial Intelligence Strategy), condivisa dall'Unione Africana, in cui si sottolinea l'impegno dell'Africa verso un approccio all'intelligenza artificiale incentrato sull'Africa e sul suo sviluppo, “promuovendo pratiche etiche, responsabili ed eque". 

Un punto su cui insiste anche il rapporto AI in Africa: A Landscape Study del Global Center on AI Governance (GCG) e African Observatory on Responsible AI, che analizza l'ecosistema dell'AI del continente: "Affinché possa portare benefici all'Africa deve essere progettata per l'Africa. La popolazione dinamica, giovane e sempre più esperta di tecnologia del continente offre l'opportunità di sviluppare soluzioni di AI non semplicemente importate, ma progettate tenendo conto delle realtà africane [...] Il potere dell'intelligenza artificiale open source risiede nella sua capacità di democratizzare l'innovazione, soprattutto in Africa, dove le startup locali possono sfruttarla per sviluppare soluzioni che affrontino le urgenti sfide della società".

Il contesto, l’esperienza vissuta

In Africa si parlano oltre 2000 lingue, un terzo di quelle parlate nel mondo, eppure strumenti come ChatGPT o DeepSeek vengono addestrati utilizzando principalmente l'inglese, le lingue europee e il cinese, mentre le lingue africane sono rimaste ai margini dello sviluppo tecnologico, in particolare dell'intelligenza artificiale. Il modello linguistico GPT-4, alla base di ChatGPT, solo nel 10-20% dei casi riconosce le frasi scritte in hausa, lingua diffusa in Africa occidentale, la più parlata nel nord della Nigeria: lo sottolinea Nyalleng Moorosi, ricercatrice del Distributed AI Research Institute, in un articolo di approfondimento pubblicato su Nature, alla fine del 2024, nel quale presenta un ulteriore punto di vista riflettendo su una questione non secondaria: per superare i limiti derivanti dall’importazione di strumenti di intelligenza artificiale privi di contesto locale in Africa è necessario offrire agli informatici africani l’opportunità di sviluppare soluzioni create sul posto, puntando alla creazione di sistemi di AI più piccoli e specifici, pensati per determinati compiti e necessità, da adattare più facilmente alle esigenze del territorio. “La nostra difficile esperienza con i modelli di intelligenza artificiale all’avanguardia mette in evidenza l’importanza del contesto locale e dell’esperienza vissuta”: Moorosi porta come esempio concreto Lesan AI, modello di traduzione e trascrizione linguistica, una piattaforma che sfrutta l'intelligenza artificiale e set di dati personalizzati per fornire traduzioni rapide e accurate per lingue parlate soprattutto in Etiopia ed Eritrea.

Come sottolinea Rachel Adams del Global Center on AI Governance, in un approfondimento pubblicato a fine settembre su The Conversation, "c'è un urgente bisogno di sviluppare meccanismi di governance che cerchino di ridistribuire i benefici di questa tecnologia. L'entità del divario nell'intelligenza artificiale è evidente. L'Africa detiene meno dell'1% della capacità globale dei data center [...] che alimentano l'intelligenza artificiale. Ciò significa che il continente dispone di infrastrutture minime per ospitare la potenza di calcolo necessaria per costruire ed eseguire modelli di intelligenza artificiale". E continua, sottolineando come, attualmente, solo il 5% dei talenti africani nel campo dell'intelligenza artificiale abbia un accesso utile e sufficiente alle risorse per la ricerca avanzata e l'innovazione. Adams fa riferimento a esempi virtuosi come il Lacuna Fund, che ha permesso a ricercatori e ricercatrici di creare “oltre 75 set di dati aperti basati sull'apprendimento automatico" in settori specifici africani, dall'agricoltura alla salute, dal clima alle lingue che dispongono di scarse risorse. Sono questioni che richiedono riflessioni profonde e azioni concrete per superare la disuguaglianza in tema di AI, questione al centro del focus del G20 per l'economia digitale in Sudafrica e di una specifica task force.

Cultura, valori, saggezza locale

Iniziative locali da una parte e soluzioni più estese dall’altra. A differenza delle soluzioni possibili su scala ridotta sopracitate, African Next Voices è un progetto imponente. Finanziato dalla Fondazione Gates, con il supporto di Meta, coinvolge una rete di università, organizzazioni e un team di linguisti, scienziati, informatici africani, puntando a colmare il divario linguistico dell'AI e rendere la tecnologia più accessibile in tutto il continente. Si tratta della "più grande iniziativa panafricana di creazione di risorse linguistiche per l’AI", scrive Sarah Wild in AI models are neglecting African languages — scientists want to change that, articolo pubblicato a luglio scorso su Nature in cui, tra le altre cose, veniva annunciata la condivisione di una prima tranche di dati.

Vukosi Marivate, Ife Adebara, Lilian Wanzare sono i referenti del progetto rispettivamente per Sudafrica, Nigeria e Kenya, e spiegano su The Conversation: "Le lingue sono portatrici di cultura, valori e saggezza locale. Se l'AI non parla le nostre lingue, non può comprendere in modo affidabile le nostre intenzioni e noi non possiamo fidarci o verificare le sue risposte. In breve: senza linguaggio, l'AI non può comunicare con noi, e noi non possiamo comunicare con lei. Costruire l'AI nelle nostre lingue è quindi l'unico modo per farla funzionare per le persone". In occasione di una intervista alla BBC Marivate, direttore di The African Institute for Data Science and Artificial Intelligence (AfriDSAI) dell'Università di Pretoria, ha aggiunto: "Pensiamo nelle nostre lingue e interpretiamo il mondo attraverso esse. Se la tecnologia non riflette questo, rischiamo di rimanere indietro". AfriDSAI risponde all'esigenza di costruire un ecosistema di intelligenza artificiale incentrato sull'Africa attraverso un dialogo tra mondo accademico, industria e governo con lo scopo di garantire che l'innovazione tecnologica sia in linea con le priorità sociali. "L'intelligenza artificiale ha un potenziale trasformativo per l'Africa ma oggi, nel panorama globale, spesso si trascurano lingue, contesti e sfide del continente". 

Verso una presenza viva e costante negli spazi digitali

Raccolti dai laboratori di Data Science for Social Impact, Data Science Nigeria, Maseno Centre for Applied AI, i dati audio raccolti da African Next Voices riguardano persone di età, genere e background educativo differenti. Ogni registrazione viene realizzata partendo da un consenso informato, un equo compenso e informazioni relative ai diritti condivise in linee guida specifiche per ogni lingua. "I modelli non saranno solo sperimentali, ma utili per chatbot, strumenti didattici e servizi di erogazione locale. Esiste l'opportunità di andare oltre i set di dati, integrandoli in ecosistemi di strumenti - correttori ortografici, dizionari, sistemi di traduzione, motori di sintesi - per rendere le lingue africane una presenza viva negli spazi digitali".

La visione a lungo termine, che prevede registrazioni in altre lingue, oltre le 18 già inserite nel programma, introduce la possibilità di estendere il progetto e rendere accessibili gli strumenti di intelligenza artificiale a tutte e tutti, senza lasciare indietro nessuno, per una democrazia della conoscenza. "L'AI integrata nelle lingue africane non solo recupererà il terreno perduto, ma stabilirà nuovi standard per un'intelligenza artificiale inclusiva e responsabile in tutto il mondo". 

© 2025 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012