Chatbot Arena: Grok 3 supera Gemini 2.0 Flash Thinking

xAI ha annunciato ieri sera il nuovo modello Grok 3. Durante la diretta streaming su X sono stati mostrati i risultati di alcuni benchmark che dimostrano la superiorità rispetto ai concorrenti. La consacrazione è arrivata da Chatbot Arena che posiziona Grok 3 in cima alla classifica.

Grok 3 supera Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking è il modello sviluppato da Google. La versione sperimentale ha occupato la prima posizione per diverse settimane, ma la concorrenza è piuttosto agguerrita. Il modello Grok 3 dell’azienda di Elon Musk è il primo a superare 1.400 punti nella classifica di Chatbot Arena. Considerato che si tratta di una versione preliminare è sicuramente un ottimo risultato.

Grok 3 occupa anche la prima posizione in tutte le categorie, tra cui scrittura creativa, risoluzione di problemi matematici e scrittura di codice, come mostrato su X. Nella scrittura di codice supera i modelli di OpenAI e Google che sfruttano il ragionamento.

La famiglia è composta da quattro modelli: Grok 3, Grok 3 mini, Grok 3 Reasoning e Grok 3 mini Reasoning. Gli ultimi due sono i concorrenti di OpenAI o3 e DeepSeek R1. Grok 3 Reasoning supera o3 mini in quasi tutti i benchmark. Gli abbonati X Premium+ (22,27 euro/mese in Italia) possono accedere in anteprima a Grok 3 e alle due capacità di ragionamento e “ricerca profonda” su Internet.

L’azienda di Elon Musk ha introdotto un nuovo abbonamento denominato SuperGrok che consente di accedere alle funzionalità più avanzate del modello Grok 3, alle query di DeepSearch e alla generazione illimitata di immagini. Il prezzo non è stato comunicato. In base alle indiscrezioni dovrebbe essere 30 dollari/mese.

Fonte: Chatbot Arena

Annulla

Stai citando questo messaggio:

NaN undefined

La tua email sarà utilizzata per comunicarti se qualcuno risponde al tuo commento e non sarà pubblicata. Dichiari di avere preso visione e di accettare quanto previsto dalla informativa privacy.
Pubblicando questo commento dai il consenso affinché un cookie salvi i tuoi dati (nome, email, sito web) per il prossimo commento.

Iscrivimi alla newsletter gratuita di Punto Informatico Tutte le mattine direttamente nella tua casella email tutte le novità del mondo digitale e tech