Chatbot Arena: Grok 3 supera Gemini 2.0 Flash Thinking

Chatbot Arena: Grok 3 supera Gemini 2.0 Flash Thinking

La versione preliminare del modello Grok 3 supera i concorrenti in tutti i benchmark e raggiunge la prima posizione della classifica di Chatbot Arena.
Chatbot Arena: Grok 3 supera Gemini 2.0 Flash Thinking
La versione preliminare del modello Grok 3 supera i concorrenti in tutti i benchmark e raggiunge la prima posizione della classifica di Chatbot Arena.

xAI ha annunciato ieri sera il nuovo modello Grok 3. Durante la diretta streaming su X sono stati mostrati i risultati di alcuni benchmark che dimostrano la superiorità rispetto ai concorrenti. La consacrazione è arrivata da Chatbot Arena che posiziona Grok 3 in cima alla classifica.

Grok 3 supera Gemini 2.0 Flash Thinking

Gemini 2.0 Flash Thinking è il modello sviluppato da Google. La versione sperimentale ha occupato la prima posizione per diverse settimane, ma la concorrenza è piuttosto agguerrita. Il modello Grok 3 dell’azienda di Elon Musk è il primo a superare 1.400 punti nella classifica di Chatbot Arena. Considerato che si tratta di una versione preliminare è sicuramente un ottimo risultato.

Grok 3 occupa anche la prima posizione in tutte le categorie, tra cui scrittura creativa, risoluzione di problemi matematici e scrittura di codice, come mostrato su X. Nella scrittura di codice supera i modelli di OpenAI e Google che sfruttano il ragionamento.

La famiglia è composta da quattro modelli: Grok 3, Grok 3 mini, Grok 3 Reasoning e Grok 3 mini Reasoning. Gli ultimi due sono i concorrenti di OpenAI o3 e DeepSeek R1. Grok 3 Reasoning supera o3 mini in quasi tutti i benchmark. Gli abbonati X Premium+ (22,27 euro/mese in Italia) possono accedere in anteprima a Grok 3 e alle due capacità di ragionamento e “ricerca profonda” su Internet.

L’azienda di Elon Musk ha introdotto un nuovo abbonamento denominato SuperGrok che consente di accedere alle funzionalità più avanzate del modello Grok 3, alle query di DeepSearch e alla generazione illimitata di immagini. Il prezzo non è stato comunicato. In base alle indiscrezioni dovrebbe essere 30 dollari/mese.

Fonte: Chatbot Arena
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
18 feb 2025
Link copiato negli appunti