DeepSeek ha usato i dati di OpenAI: ci sono le prove

DeepSeek ha usato i dati di OpenAI: ci sono le prove

Secondo OpenAI, DeepSeek ha utilizzato i dati di output dei suoi modelli per addestrare il modello R1 (distillazione), violando i termini del servizio.
DeepSeek ha usato i dati di OpenAI: ci sono le prove
Secondo OpenAI, DeepSeek ha utilizzato i dati di output dei suoi modelli per addestrare il modello R1 (distillazione), violando i termini del servizio.

Secondo David Sacks, scelto da Trump come consulente per criptovalute e intelligenza artificiale, DeepSeek avrebbe usato i dati di OpenAI per addestrare il modello R1. L’azienda californiana ha comunicato di aver trovato le prove sull’uso della tecnica nota come “distillazione”.

DeepSeek ruba i dati di OpenAI

DeepSeek ha sviluppato il modello R1 con circa 2.000 GPU NVIDIA H800, spendendo meno di 6 milioni di dollari. Le sue prestazioni sono simili o superiori a quelle del modello o1 di OpenAI. La startup cinese ha ricevuto i complimenti da NVIDIA, Sam Altman (CEO di OpenAI) e Satya Nadella (CEO di Microsoft), ma nelle ultime ore sono emersi dubbi sul modo in cui è stato raggiunto il risultato finale.

Bloomberg aveva scritto stamattina che OpenAI e Microsoft hanno avviato indagini su quanto ipotizzato da David Sacks. I ricercatori di sicurezza dell’azienda di Redmond sospettano che DeepSeek abbia usato diversi account sviluppatore per esfiltrare i dati di OpenAI tramite API.

L’azienda guidata da Sam Altman ha dichiarato al Financial Times di aver trovato le prove. DeepSeek avrebbe sfruttato la tecnica della distillazione per addestrare il suo modello R1 con i dati di output dei modelli di OpenAI. Questa pratica è vietata dai termini del servizio.

Un portavoce di OpenAI ha dichiarato:

Sappiamo che le aziende cinesi cercano costantemente di distillare i modelli delle principali aziende di intelligenza artificiale statunitensi. Utilizziamo contromisure per proteggere la nostra proprietà intellettuale e stiamo lavorando a stretto contatto con il governo degli Stati Uniti per proteggere al meglio i modelli più capaci dai tentativi di avversari e concorrenti di accedere alla tecnologia statunitense.

Ironicamente, OpenAI è stata spesso accusata di utilizzare i dati pubblici su Internet senza consenso (è in corso uno scontro legale con il New York Times). Gli utenti dovrebbe invece prestare attenzione alla privacy perché molte informazioni raccolte da DeepSeek sono inviate a server in Cina. Il Garante italiano ha chiesto informazioni alla startup cinese.

Fonte: The Verge
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
29 gen 2025
Link copiato negli appunti