Ennesima denuncia per violazione di copyright presentata contro le aziende che sviluppano tecnologie di intelligenza artificiale generativa. Nel mirino di tre autori è finita stavolta NVIDIA, accusata di aver usato copie dei libri per addestrare la piattaforma NeMo senza autorizzazione.
NVIDIA ha usato i libri senza permesso
È noto che i modelli di intelligenza artificiale generativa sono addestrati con dati pubblicati su Internet. Durante il cosiddetto “scraping” vengono raccolti specifici dataset condivisi da biblioteche pirata. Una di esse è Bibliotik che ospita un’enorme collezione di e-book e audiolibri.
I tre autori, ovvero Brian Keene, Abdi Nazemian and Stewart O’Nan, affermano che i loro lavori sono inclusi in un dataset di 196.640 libri digitali che NVIDIA ha usato per migliorare la comprensione del linguaggio scritto da parte di NeMo. Reuters non indica il nome del dataset, ma dovrebbe essere Book3 di Bibliotik (usato anche da OpenAI e Meta, secondo le denunce ricevute dalle due aziende) che è stato rimosso da Hugging Face proprio per la violazione del copyright.
I tre autori hanno chiesto al giudice di approvare lo status di class action e un risarcimento danni (non quantificato) per l’uso non autorizzato dei libri da parte di NVIDIA negli ultimi tre anni. Al momento non è arrivato nessun comunicato ufficiale dall’azienda californiana.
In altri simili casi, le aziende accusate di violazione del diritto d’autore hanno sottolineato che si tratta di “fair use” consentito dalle norme attuali. Finora nessun giudice ha dato ragione agli autori, in quanto manca una legge specifica.