SCIENZA E RICERCA

Paesaggi sonori. Non solo carta: informatica e archivi audio

"I romanzi non si fanno con i documenti, i romanzi si fanno con le voci" (Maurizio Maggiani, Il romanzo della nazione, Feltrinelli, Milano 2015)

Un archivio audio (o sonoro) è costituito da una o più raccolte di supporti analogici audio (dischi fonografici e/o nastri magnetici) o di file contenenti registrazioni musicali, trasmissioni radiofoniche, interviste o spettacoli. Esempi di grandi archivi sonori sono Library of Congress, Syracuse University's audio archive, British Library Sound Archive, Internet Archive's Audio Archive, Australian National Film and Sound Archive e, in Italia, l'Istituto centrale per i beni sonori e audiovisivi, già Discoteca di Stato.

A differenza delle informazioni di tipo figurativo e grafico, che spesso frammiste tra loro risalgono talvolta alle prime testimonianze dell'attività umana, si può ritenere che le prime informazioni di tipo acustico siano state memorizzate mediante il fonografo di Edison nel 1877, ossia neppure 150 anni or sono (in realtà il primo apparecchio a poter registrare suoni automaticamente fu il fonautografo, sviluppato nel 1857 da Édouard-Léon Scott de Martinville, ma non era in grado di riprodurli). In questo periodo di tempo relativamente breve le tecnologie adottate per conservare segnali acustici (parola, musica) hanno subìto continue trasformazioni e innovazioni: solo per richiamare le tappe più importanti si può ricordare il passaggio dai cilindri di Edison ai dischi del grammofono di Berliner, dall'impiego della cera a quello della gommalacca e poi delle resine sintetiche, dalla registrazione e riproduzione meccanica a quella elettrica. Si è assistito inoltre all'avvento dei sistemi ottici di registrazione e lettura delle colonne sonore affiancate ai fotogrammi delle pellicole cinematografiche e, successivamente, all'impiego di sistemi di memorizzazione su supporti magnetici, con l'evoluzione dai sistemi di registrazione continua (ossia analogica) alla memorizzazione in forma discreta di valori numerici (registrazione digitale), con l’adozione di supporti di tipo ottico costituiti dai cosiddetti compact disc (poi dvd, e ora blu-ray), sino ad arrivare alla moderna memorizzazione in remoto (sulla “nuvola”) di file compressi (mp3, aac) con cui si possono realizzare servizi di streaming on-demand, come il diffuso Spotify.

Nonostante la grande varietà delle tecnologie impiegate e il loro continuo perfezionamento, le informazioni acustiche, a differenza di quelle grafiche o figurative, hanno dimostrato di essere estremamente labili, cioè soggette sia a degradazione, sia a possibilità di perdita irreparabile in tempi relativamente brevi. Una causa di tali inconvenienti risiede nella deperibilità dei supporti impiegati: le cere, le lacche, le gelatine fotosensibili e altri materiali di origine organica possono essere sottoposti all'attacco di muffe o altri parassiti; inoltre, fenomeni di cristallizzazione li rendono estremamente fragili e inadatti al loro impiego a distanza di tempo. Anche le resine sintetiche adottate per i dischi e per i supporti magnetici sono soggette a deformazioni e invecchiamento: spesso gli strati di ossidi magnetici perdono particelle o si sgretolano, la loro magnetizzazione poi tende ad affievolirsi e a trasferirsi alle spire adiacenti nelle bobine dei nastri magnetici. Pure le resine sintetiche dei compact disc, alla lunga, si possano alterare rendendone difficile o impossibile la lettura.

A tutta questa serie di iatture si aggiungono spesso difficoltà legate proprio al continuo evolversi delle tecnologie adottate. Infatti, non bisogna trascurare che, contrariamente ai contenuti dei documenti cartacei, che possono venire direttamente letti dall’essere umano, le informazioni memorizzate nei supporti sonori devono essere mediate da strumenti tecnologici - dai grammofoni ai lettori mp3 - per poter essere ascoltate. Per cui, taluni supporti, eventualmente già di per sé degradati, non trovano la possibilità di venire letti: i lettori adatti possono essere pezzi da museo, magari non funzionanti, oppure presentare costi inaccessibili. Una simile sorte, benché ciò possa sembrare incredibile, è destinata alle informazioni registrate in forma digitale appena qualche decina di anni or sono: i dispositivi per la loro lettura non vengono più tenuti in funzione (o lo saranno ancora per brevissimo tempo) perché la loro manutenzione risulta troppo costosa o impossibile, causa dismissione di componenti necessari al loro funzionamento. È esperienza comune la difficoltà di leggere un “vecchio” floppy disk oppure la memoria di un telefono cellulare di soli pochissimi anni fa, magari piena di file audio - in copia unica - con la voce di un caro parente o con una preziosa intervista di lavoro. Anche i formati dei file audio sono soggetti a un ricambio tecnologico e non sempre i nuovi lettori sono in grado di far ascoltare i vecchi formati.

Con un panorama così desolante viene spontaneo preoccuparsi di fare presto per salvare il salvabile di un immenso patrimonio di dati in continua espansione.

Cosa c’entra l’ingegneria dell’informazione con i documenti sonori?

La vita di un uomo, da queste parti, è spesso legata al filo di un’informazione (Benito Rojo, dal film Per un pugno di dollari (1964) di Sergio Leone)

L’evoluzione della tecnologia dell’informazione, e in particolare dell’informatica, ha dato origine a nuove sfide per la progettazione e l’organizzazione degli archivi e per la conservazione del patrimonio culturale e orale. Paradossalmente, questa grande dipendenza dalla tecnologia rende gli archivi audio particolarmente vulnerabili. In un archivio, molti documenti sono memorizzati nel dominio analogico (per esempio: carta, nastri magnetici, dischi fonografici, pellicole). Questi devono essere trasferiti nel dominio digitale, in altri formati e con codifica diversa (ri-mediazione), sia per garantire l'accesso pubblico, tramite internet o rete locale (copia di accesso), sia per la conservazione a lungo termine (master di conservazione, quindi archiviati in copie e posizioni diverse, in locale e nel cloud), vista la modesta, soprattutto se confrontata con la carta, aspettativa di vita dei documenti audio analogici, limitata a qualche decina d’anni, comunque inferiore al secolo.

“I documenti non durano in eterno, Hari. Le banche dati possono essere distrutte o cancellate in seguito a qualche conflitto, o possono semplicemente deteriorarsi col tempo. Ogni bit di memoria, ogni registrazione che non viene utilizzata per molto tempo, alla fine svanisce nel rumore puro”. “Non riesco a crederci” disse Seldon “Non bisognerebbe fare copie del materiale che rischia di deteriorarsi? Come avete potuto lasciar scomparire così la conoscenza?” (Isaac Asimov, Preludio alla Fondazione, Milano, Mondadori, 1989)

Il trasferimento nel dominio digitale

In accordo con le disposizioni internazionali, è necessario articolare il processo di trasferimento del documento nel dominio digitale in tre fasi: predisposizione del supporto, trasferimento del segnale ed elaborazione dei dati raccolti. Ogni fase prevede a sua volta tanti passaggi che coinvolgono diverse figure professionali: archivisti, chimici, compositori, ingegneri, musicisti, musicologi, tecnici del suono. Il risultato è un lavoro multidisciplinare il cui successo dipende anche dalla diffusione e dalla condivisione di queste pratiche tra gli archivi.

La conservazione dei documenti in un archivio audio ha come obiettivo naturale quello di consentire agli studiosi, e anche al pubblico, l'accesso alle informazioni conservate. Questa fase non può coinvolgere il master di conservazione, che deve essere lasciato inalterato: devono quindi essere create opportune copie di accesso. Solo quest'ultime possono essere utilizzate da terzi e possono essere oggetto di restauro digitale per fini concertistici o per un'edizione commerciale.

Intelligenza artificiale e patrimonio culturale: un matrimonio di interesse?

The development of full artificial intelligence could spell the end of the human race. It would take off on its own, and re-design itself at an ever-increasing rate. Humans, who are limited by slow biological evolution, couldn’t compete, and would be superseded (Stephen Hawking, From an interview with the BBC, December 2014)

Una prima ispezione visiva del documento originale (analogico) può mostrare la presenza di diverse alterazioni del supporto. In un nastro magnetico - forse il supporto audio più utilizzato nella seconda metà del Novecento, nelle sue versioni a bobina aperta o a cassetta -, si possono facilmente trovare: giunzioni del nastro magnetico effettuate durante la produzione o in una fase di monitoraggio dell’archivio, marchi sul nastro, costituiti dal nome completo del produttore del nastro, dal logo o dai codici del modello del nastro (il marchio cambia in dimensioni, forma e colore, a seconda del nastro utilizzato, complicando così il compito di classificazione), estremità del nastro, ovvero il punto in cui non è in tensione e neppure in contatto con i piccoli rulli pressori del registratore (la caratteristica visiva distintiva di questa classe è il nastro “libero”, completamente staccato dalle flange plastiche), nastro danneggiato da varie corruttele possibili, per esempio increspature, flessione anomala della superficie, perdita di pasta magnetica. E ancora, la presenza di sporcizia, dalle muffe alla polvere, dai cristalli alle contaminazioni biologiche. Infine, segni o parole scritte sul retro, ossia il lato non magnetizzato, o sul nastro adesivo delle giunzioni.


Al Centro di Sonologia Computazionale (CSC) è stato sviluppato il software Video analyzer find alteration (VAFA) per rilevare i frame significativi, che contengono informazioni sulle alterazioni, automaticamente dal video digitale. Il rilevamento si concentra su due aree. La prima è la testina di lettura del registratore. Il secondo è sotto il rullo pressore. Partendo dal video originale, rileva le aree di interesse in ogni frame e quindi utilizza un algoritmo in grado di classificare le immagini utilizzando reti neurali. Il dataset di training è costituito da più di 100mila documenti ottenuti grazie ai progetti di conservazione.

I più rappresentativi sono: Paul Sacher Stiftung Archive, collezione di Luciano Berio (musica su nastro, musica elettronica), Archivio Luigi Nono, tutte le collezioni (musica su nastro, musica elettronica), Teatro Regio di Parma, tutte le collezioni (opera, musica classica occidentale, pop/rock), Archivio Tullia Magrini (etnomusica), Istituto per i Beni Artistici, Culturali e Naturali della Regione Emilia Romagna (etnomusica, parlato), Fondazione Giorgio Cini, Venezia. La precisione misurata è tra il 70% e il 100%, a seconda del tipo di alterazione. È il primo approccio di questo tipo a livello mondiale.


 

Va bene conservare, ma per ascoltare?

La potenza è nulla senza controllo (campagna pubblicitaria Pirelli, coniato nel 1994 dall'agenzia Young&Rubicam)

La metodologia di accesso è complementare a quella di conservazione e ne condivide l'obiettivo finale: ottenere una copia il più fedele possibile all'originale. La fedeltà deve essere valutata secondo tre criteri distinti: la riproduzione del contenuto audio, la simulazione dell'esperienza di ascolto originale, e la completezza dei metadati e delle informazioni contestuali. Il primo criterio è determinato principalmente da tre fattori: numero di tracce, velocità di riproduzione ed equalizzazione. Il primo fattore è essenziale in quanto un nastro magnetico analogico può ospitare da 1 a 24 diverse colonne sonore. Un lettore cd stereofonico non è adatto alla riproduzione di audio proveniente, per esempio, da un nastro musicale multitraccia di originali registrazioni di musica rock degli anni Settanta del Novecento, contenente usualmente 16 o 24 tracce, non consentendo la proiezione acustica delle diverse tracce indipendentemente. Per quanto riguarda il secondo fattore, non è raro trovare sezioni dello stesso nastro registrate a velocità diverse. La metodologia prevede la memorizzazione nel master di conservazione di più copie digitali del nastro riprodotto a diverse velocità di lettura: anche in questo caso il passaggio da una velocità all'altra è tutt'altro che agevole utilizzando lettori digitali generici. Inoltre, la velocità di riproduzione è strettamente legata all’equalizzazione del suono: al variare della prima cambiano anche le caratteristiche della curva di filtraggio. Se questo non viene corretto, l'ascolto non sarà più fedele al documento originale.

Per approfondire

Bressan F., Canazza S. 2013, A Systemic Approach to the Preservation of Audio Documents: Methodology and Software Tools, “Journal of Electrical and Computer Engineering”, article ID 489515, 21 pages. 

Canazza, S., De Poli, G., Vidolin, A. (2020). I primi 40 anni del Centro di Sonologia Computazionale di Padova. Un intreccio di saperi tra ricerca scientifica, creatività musicale e alta formazione. Cleup, Padova, dicembre 2020. 

Canazza S., De Poli G. 2019, Four Decades of Music Research, Creation, and Education at Padua's Centro di Sonologia Computazionale, “Computer Music Journal”, 43(4), pp.58-80.

Pretto N., Russo A., Bressan F., Burini V., Rodà A., Canazza S. 2020, Active preservation of analogue audio documents: a summary of the last seven years of digitization at CSC, in “Proceedings of the 17th Sound and Music Computing Conference 2020”, SMC’20, Torino, Italy. https://zenodo.org/record/3898905#.YZUVuC9aZpQ

© 2018 Università di Padova
Tutti i diritti riservati P.I. 00742430283 C.F. 80006480281
Registrazione presso il Tribunale di Padova n. 2097/2012 del 18 giugno 2012