OpenAI ha annunciato diverse novità prima di Natale, tra cui la versione finale del modello o1, ChatGPT Pro, Sora, ChatGPT Search e i modelli o3. L’azienda californiana (che diventerà una public benefit corporation) non ha però mantenuto ancora la promessa di offrire il tool Media Manager che consentirà di escludere i dati dall’addestramento dei modelli.
Media Manager non è una priorità
Dopo aver utilizzato una quantità enorme di dati pubblici (principalmente quelli presenti su Internet) per l’addestramento dei modelli di intelligenza artificiale generativa e ricevuto decine di denunce per violazione di copyright (la più nota è quella del New York Times), OpenAI ha iniziato a sottoscrivere accordi commerciali con gli editori.
Quasi 8 mesi fa aveva inoltre annunciato lo sviluppo di un tool che rispetta la decisione dei creatori di contenuti (testo, immagini, video e audio). Attualmente l’unico modo per negare l’accesso è usare il Robots Exclusion Protocol (file robots.txt
) per bloccare il crawler GPTBot, ma non è una soluzione molto efficace.
Media Manager permetterà di indicare cosa includere o escludere dall’addestramento dei modelli. OpenAI aveva scritto un generico “entro il 2025“, ma non ha più fornito aggiornamenti sulla data di lancio. Un portavoce aveva confermato ad agosto 2024 che il tool è ancora in sviluppo. Un ex dipendente ha dichiarato che non è una priorità.
Alcuni avvocati credono che il tool non servirà a molto, considerate le varie normative locali e nazionali sul diritto d’autore. Secondo il fondatore di Fairly Trained, Media Manager potrebbe essere usata come “arma” da OpenAI. I creatori dei contenuti saranno obbligati ad usarlo, altrimenti daranno un permesso tacito.