Pasquale De Rose

Adobe VoCo, il Photoshop per l'audio

Algoritmi sperimentali permettono di modificare il parlato senza lasciare traccia. Affascinante. Ma un rischio per taroccare le dichiarazioni altrui?

Roma - Adobe, azienda nota per i suoi prodotti di video e grafica digitale, ha stupito gli spettatori della Adobe MAX, conferenza tenutasi a San Diego in California, presentando quello che può essere considerato il Photoshop dell'audio. La nuova applicazione dal nome in codice VoCo, sviluppata in collaborazione con l'università di Princeton, è stata presentata da Zeyu Jin, uno degli sviluppatori del team, che ne ha mostrato la feature principale ovvero quella di aggiungere, cambiare o eliminare parole dall'audio come se fosse testo.


Si potranno quindi inserire nuove porzioni di parlato all'interno del file sorgente adattandole al tono di voce di chi parla dopo un processo di sintetizzazione reso possibile dall'algoritmo CUTE che converte il testo in audio facendo uso di campioni vocali. L'inserimento richiederà per ogni parola circa 20 minuti, lasso di tempo del tutto accettabile per un risultato così accurato, e ogni aspetto di questo processo è descritto in un paper rilasciato all'inizio di quest'anno.


La demo mostrata, come sottolineato dai colleghi di The Verge, è solamente un prototipo e la dimostrazione può essere considerata come una sbirciata a quello che Adobe ha in serbo per il futuro e non è chiaro quando il programma verrà rilasciato e se per scopi commerciali. Il software, nonostante faccia sorgere alcuni dubbi sull'etica di determinate azioni che si possono svolgere col programma, risulta utile in compiti di editing come correggere errori di pronuncia o ripulire registrazioni e podcast.

Anche Google e Microsoft avevano precedentemente manifestato l'interesse nel Voice Conversion pur adottando metodologie diverse.

Pasquale De Rose

fonte immagini: 1, 2
Notizie collegate
3 Commenti alla Notizia Adobe VoCo, il Photoshop per l'audio
Ordina