xAI ha annunciato ieri sera il nuovo modello Grok 3. Durante la diretta streaming su X sono stati mostrati i risultati di alcuni benchmark che dimostrano la superiorità rispetto ai concorrenti. La consacrazione è arrivata da Chatbot Arena che posiziona Grok 3 in cima alla classifica.
Grok 3 supera Gemini 2.0 Flash Thinking
Gemini 2.0 Flash Thinking è il modello sviluppato da Google. La versione sperimentale ha occupato la prima posizione per diverse settimane, ma la concorrenza è piuttosto agguerrita. Il modello Grok 3 dell’azienda di Elon Musk è il primo a superare 1.400 punti nella classifica di Chatbot Arena. Considerato che si tratta di una versione preliminare è sicuramente un ottimo risultato.
Grok 3 occupa anche la prima posizione in tutte le categorie, tra cui scrittura creativa, risoluzione di problemi matematici e scrittura di codice, come mostrato su X. Nella scrittura di codice supera i modelli di OpenAI e Google che sfruttano il ragionamento.
La famiglia è composta da quattro modelli: Grok 3, Grok 3 mini, Grok 3 Reasoning e Grok 3 mini Reasoning. Gli ultimi due sono i concorrenti di OpenAI o3 e DeepSeek R1. Grok 3 Reasoning supera o3 mini in quasi tutti i benchmark. Gli abbonati X Premium+ (22,27 euro/mese in Italia) possono accedere in anteprima a Grok 3 e alle due capacità di ragionamento e “ricerca profonda” su Internet.
L’azienda di Elon Musk ha introdotto un nuovo abbonamento denominato SuperGrok che consente di accedere alle funzionalità più avanzate del modello Grok 3, alle query di DeepSearch e alla generazione illimitata di immagini. Il prezzo non è stato comunicato. In base alle indiscrezioni dovrebbe essere 30 dollari/mese.