DeekSeek ha dimostrato che si possono sviluppare modelli di intelligenza artificiale generativa con meno di 6 milioni di dollari. Gli Stati Uniti hanno avviato un’indagine per scoprire se l’azienda cinese aggira le restrizioni sulle esportazioni dei chip AI. L’amministrazione Trump potrebbe aggiornare l’elenco delle GPU per evitare la vendita in Cina delle NVIDIA H20.
Quali GPU ha usato DeepSeek?
DeepSeek ha comunicato che i modelli V3 e R1 sono stati addestrati con circa 2.000 GPU NVIDIA H800 acquistate prima dell’entrata in vigore delle restrizioni imposte dagli Stati Uniti ad ottobre 2023. Secondo SemiAnalysis, l’azienda cinese ha acquistato circa 50.000 GPU NVIDIA basate sull’architettura Hopper. Oltre alle H800 avrebbe anche le H100 e H20.
Le NVIDIA H100 non possono essere esportate in Cina da ottobre 2022, quindi il governo statunitense sospetta che DeepSeek abbia aggirato le restrizioni attraverso terze parti a Singapore. In questo paese, oltre che in Malaysia e negli Emirati Arabi Uniti, c’è un fiorente mercato nero delle GPU NVIDIA. L’azienda californiana ha dichiarato che i suoi clienti a Singapore rispettano la legge statunitense.
DeepSeek avrebbe quindi utilizzato GPU NVIDIA soggette alle restrizioni (H800), ma acquistate in precedenza, GPU acquistate al mercato nero (H100) e GPU non soggette alle restrizioni (H20). L’amministrazione Trump potrebbe estendere il ban anche alle GPU H20, nonostante le loro prestazioni inferiori. La decisione era già prevista sotto la precedente amministrazione.
I risultati del modello R1 sono stati messi in discussione dai principali concorrenti. DeepSeek avrebbe usato i dati di output dei modelli di OpenAI per addestrare il suo modello sfruttando la tecnica della distillazione.