L’azienda di Cupertino ha comunicato che il suo modello OpenELM non viene utilizzato per nessuna funzionalità di intelligenza artificiale, incluse quelle che gli utenti troveranno in iOS 18, iPadOS 18 e macOS 15 Sequoia, note come Apple Intelligence. La precisazione arriva in risposta all’indagine effettuata da Proof News in collaborazione con Wired.
OpenELM usato solo a scopi di ricerca
YouTube vieta lo scraping dei contenuti senza autorizzazione. Proof News ha scoperto un dataset, denominato YouTube Subtitles, che contiene i sottotitoli di 173.536 video pubblicati da oltre 48.000 canali, tra cui quelli gestiti da note star come MrBeast, Marques Brownlee e PewDiePie.
Il dataset, parte della compilation The Pile creata da EleutherAI, sarebbe stata utilizzata da Anthropic, Nvidia, Apple, Salesforce e altre Big Tech per l’addestramento dei rispettivi modelli di IA generativa. Nel documento che descrive il modello OpenELM, Apple conferma l’uso di The Pile per il training di OpenELM, un modello open source rilasciato nel mese di aprile.
L’azienda di Cupertino ha comunicato che OpenELM non viene utilizzato per nessuna funzionalità IA, come Apple Intelligence. Il modello è disponibile solo per scopi di ricerca. In pratica, le trascrizioni dei video pubblicati su YouTube non sono sfruttati per l’addestramento di modelli dai quali Apple ottiene un profitto.
Una portavoce di Anthropic ha sottolineato che The Pile include solo un piccolo sottoinsieme del dataset YouTube Subtitles. In ogni caso, gli autori di The Pile sono i responsabili di eventuali violazioni del copyright, non le aziende che usano il dataset.