Lo YouTuber David Millette ha presentato il 14 agosto una denuncia contro NVIDIA per aver utilizzato i suoi video durante l’addestramento dei modelli di intelligenza artificiale, come avevano scoperto i giornalisti di 404 Media all’inizio del mese. Circa due settimana prima aveva denunciato anche OpenAI per lo stesso motivo.
Scraping senza autorizzazione
Nella denuncia contro NVIDIA è scritto che l’azienda californiana ha effettuato lo scraping di milioni di video per addestrare il software Cosmos AI in violazione dei termini d’uso di YouTube. Questi video sono stati utilizzati senza il consenso esplicito degli autori. NVIDIA ha quindi ottenuto un ingiusto arricchimento e violato la legge sulla concorrenza della California (Unfair Competition Law).
Come hanno scoperto i giornalisti di 404 Media, i dipendenti di NVIDIA hanno fino a 30 macchine virtuali su Amazon Web Services con indirizzi IP variabili (per aggirare i controlli di YouTube) e scaricato milioni di video usando il tool open source yt-dlp. Un portavoce dell’azienda californiana ha dichiarato:
Rispettiamo i diritti di tutti i creatori di contenuti e siamo certi di lavorare nel pieno rispetto della legge. Chiunque è libero di apprendere fatti e idee da fonti disponibili al pubblico. Creare opere nuove e trasformative non è solo giusto e imparziale, ma è esattamente ciò che il nostro sistema legale incoraggia.
Lo YouTuber ha accusato NVIDIA di violazione del copyright, ingiusto arricchimento e concorrenza sleale. Chiede pertanto un risarcimento danni, un’ingiunzione e il riconoscimento della status di class action.
Una simile denuncia è stata presentata anche contro OpenAI, in quanto avrebbe utilizzato i video per l’addestramento dei modelli GPT, come scoperto da Proof News a metà luglio. L’azienda guidata da Sam Altman ha inoltre ottenuto l’audio dei video con Whisper (tool di riconoscimento vocale), come riportato all’inizio di aprile dal New York Times.