A fine dicembre, il New York Times aveva evidenziato le difficoltà incontrate da OpenAI per raggiungere un accordo con gli editori. Le fonti di The Information hanno svelato quanto l’azienda californiana avrebbe offerto per inserire le news nei dataset di addestramento. La somma è piuttosto bassa anche per gli editori più piccoli.
Solo 5 milioni di dollari all’anno
OpenAI ha già ricevuto diverse denunce (la più recente dal New York Times) per aver utilizzato libri, articoli e altri contenuti protetti dal diritto d’autore durante l’addestramento dei suoi modelli di intelligenza artificiale generativa.
La raccolta dei dati, nota come scraping, viene effettuata tramite crawler simili a quelli usati dai motori di ricerca per indicizzare le pagine web. Quello di OpenAI (GPTBot) è stato bloccato da molti editori, ma l’azienda californiana continua a “rastrellare” Internet. In seguito alle numerose denunce, OpenAI ha avviato trattative per sottoscrivere accordi di licenza.
Secondi le fonti di The Information, la somma offerta varia tra 1 e 5 milioni di dollari all’anno. Si tratta di una cifra molto bassa anche per gli editori più piccoli. Ciò spiegherebbe le difficoltà incontrate per raggiungere un accordo. Forse OpenAI dovrebbe offrire di più, considerato che le entrate del 2023 hanno superato 1,6 miliardi di dollari e che la valutazione di mercato potrebbe superare i 100 miliardi di dollari.
Al momento non sono arrivati commenti dall’azienda californiana. OpenAI ha comunque sottoscritto accordi di licenza con The Associated Press e Alex Springer. Apple avrebbe offerto 50 milioni di dollari per accedere agli articoli da usare per l’addestramento del suo modello che dovrebbe essere integrato in iOS 18.