Secondo un rapporto di 404 Media, Runway ha utilizzato migliaia di video di YouTube e film pirata per addestrare il suo generatore AI text-to-video. Un foglio di calcolo ottenuto dalla rivista online, rivela che il set di dati di addestramento include collegamenti a canali YouTube di grandi aziende di intrattenimento, creatori di contenuti e testate giornalistiche, oltre a siti di pirateria come KissCartoon.
Un ex dipendente di Runway rivela i dettagli dell’addestramento
Un ex dipendente di Runway ha spiegato a 404 Media che i canali presenti nel foglio di calcolo rappresentavano uno sforzo dell’intera azienda per trovare video di alta qualità con cui costruire il modello. Questi video sono stati poi utilizzati come input per un web crawler che ha scaricato tutti i contenuti dai canali, utilizzando dei proxy per evitare di essere bloccato da Google.
Runway: una startup di AI supportata da giganti del settore
Runway, che ha ricevuto milioni di finanziamenti da Alphabet e Nvidia, è nota per i suoi strumenti impressionanti che permettono agli utenti di creare video AI realistici e di catturare particolari stili di animazione. Il suo ultimo strumento, Gen-3 Alpha, lanciato a giugno, è in grado di generare video in qualsiasi stile immaginabile.
Incertezza sui dati di addestramento effettivamente utilizzati
Non è ancora chiaro se Runway abbia effettivamente utilizzato tutti i video presenti nel foglio di calcolo per addestrare il suo modello Gen-3 Alpha. In un’intervista rilasciata a TechCrunch a giugno, il cofondatore di Runway, Anastasis Germanidis, ha dichiarato che l’azienda utilizza “insiemi di dati curati e interni” per l’addestramento, senza aver fornito ulteriori dettagli.
YouTube e altre aziende di AI coinvolte nella questione
Google ha indicato che l’addestramento dell’AI sui video di YouTube è una chiara violazione delle politiche della piattaforma, come dichiarato dal CEO Neal Mohan ad aprile. Runway non è l’unica azienda di AI i cui dati di addestramento sono stati collegati a YouTube: anche OpenAI con Sora, Anthropic, Apple, Nvidia e Salesforce sembrano aver addestrato i loro modelli su un gran numero di video della piattaforma.