DeepSeek-R1, il modello AI cinese che sfida o1 di OpenAI

DeepSeek, una società di ricerca sull’AI cinese, ha presentato un’anteprima di DeepSeek-R1, un modello AI “ragionante”. L’azienda sostiene che può competere con o1 di OpenAI.

La cosa “strana” è che DeepSeek è sostenuta da High-Flyer Capital Management, un hedge fund quantitativo cinese che utilizza l’intelligenza artificiale per prendere le proprie decisioni di trading. Ma c’è di più. High-Flyer mira a raggiungere l’AI “superintelligente” attraverso la sua organizzazione DeepSeek e costruisce i propri cluster di server per l’addestramento dei modelli, il più recente dei quali avrebbe 10.000 GPU Nvidia A100 e sarebbe costato 1 miliardo di yen (~138 milioni di dollari).

DeepSeek-R1, il modello AI cinese che ragiona come o1 di OpenAI

A differenza della maggior parte dei sistemi AI, i modelli che “ragionano” si auto-verificano, dedicando più tempo a considerare una domanda o una query. Questo li aiuta a evitare alcuni degli errori in cui i modelli normalmente incappano.

🚀 DeepSeek-R1-Lite-Preview is now live: unleashing supercharged reasoning power!

🔍 o1-preview-level performance on AIME & MATH benchmarks.
💡 Transparent thought process in real-time.
🛠️ Open-source models & API coming soon!

🌐 Try it now at https://t.co/v1TFy7LHNy #DeepSeek pic.twitter.com/saslkq4a1s

— DeepSeek (@deepseek_ai) November 20, 2024

DeepSeek-R1, come o1 di OpenAI, ragiona sui compiti, pianifica in anticipo ed esegue una serie di azioni che aiutano il modello a giungere a una risposta. Questo processo può richiedere del tempo, anche decine di secondi, a seconda della complessità della domanda.

DeepSeek afferma che DeepSeek-R1 offre prestazioni pari al modello o1-preview di OpenAI su due popolari benchmark di IA, AIME e MATH. Tuttavia, il modello non è perfetto. Alcuni utenti su X hanno notato che il sistema fatica con il tris e altri problemi logici (come fa anche o1).

Inoltre, DeepSeek-R1 sembra bloccare le domande “scomode” sulla politica (es. sul leader cinese Xi Jinping, su Piazza Tienanmen, ecc.). Questo comportamento è probabilmente il risultato della pressione del governo cinese sui progetti di intelligenza artificiale nel Paese. Non dimentichiamo che in Cina i modelli AI devono essere sottoposti a benchmark da parte del regolatore internet cinese per garantire che le loro risposte “incarnino i valori socialisti fondamentali“.

Si dice che il governo sia arrivato al punto di proporre una lista nera di fonti che non possono essere utilizzate per addestrare i modelli. Molti sistemi AI cinesi quindi si rifiutano di rispondere a argomenti che potrebbero suscitare l’ira dei regolatori… Al di là delle indiscrezioni, DeepSeek afferma di voler rendere open source DeepSeek-R1 e rilasciare un’API.

Annulla

Stai citando questo messaggio:

NaN undefined

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech