La IA che ricrea i discorsi di Obama

La IA che ricrea i discorsi di Obama

Una nuova ricerca sull'intelligenza artificiale riesce a "simulare" la sincronizzazione labiale tra quello che l'ex-presidente dice e quello che appare in video. Un potenziale asso nella manica dei creatore di fake news?
Una nuova ricerca sull'intelligenza artificiale riesce a "simulare" la sincronizzazione labiale tra quello che l'ex-presidente dice e quello che appare in video. Un potenziale asso nella manica dei creatore di fake news?

I ricercatori dell’Università di Washington hanno sfruttato il notevole materiale audiovisivo prodotto dai discorsi di Barack Obama per “giocare” con l’intelligenza artificiale e la sincronizzazione labiale . Il risultato apre scenari promettenti ma anche inquietanti sulla manipolazione di audio e video che sarà possibile in un futuro non molto lontano.

Nello studio opportunamente chiamato Synthesizing Obama , Supasorn Suwajanakorn e colleghi hanno addestrato la loro IA basata su reti neurali dandole in pasto diciassette ore di materiale audio, così da poter replicare in maniera credibile il movimento della bocca del presidente. La scelta è caduta su Obama perché i contenuti audiovisivi di buona qualità raccolti sull’ex-inquilino della Casa Bianca sono abbondanti e di facile accesso, dicono i ricercatori.

Il risultato finale, ovviamente disponibile in video, è la capacità di sincronizzare con una certa fedeltà i discorsi fatti da Obama in un dato momento con un framework video completamente diverso. Il nuovo “speech” fasullo non è completamente naturale, nondimeno l’approssimazione è buona e le capacità della tecnologia risultano comprovate.


In futuro i tempi di training della IA per sincronizzare audio e video dovrebbero ridursi ad un’ora, sostengono i ricercatori , mentre tra le possibili applicazioni del nuovo metodo vengono indicate le chat video via Skype o altri tool similari: un utente comune potrebbe “istruire” il suo client, così da ridurre in maniera sensibile la quantità di dati da trasmettere in rete nei casi in cui la connessione fosse soggetta a costrizioni.

Quello su cui i ricercatori mettono in guardia, infine, è il potenziale impiego della tecnologia per scopi molto meno legittimi: dalla sincronizzazione di audio e video differenti alla creazione di “fake news” visivamente realistiche il passo è breve , ancor più se associato all’uso di tool per la riproduzione della voce come Lyrebird . La falsificazione a prova di nativi digitali è (quasi) servita.

Alfonso Maruccia

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
13 lug 2017
Link copiato negli appunti