Elon Musk ha annunciato ieri la disponibilità di Grok (in versione beta per alcuni utenti), il chabot sviluppato da xAI. L’azienda ha ora fornito tutti i dettagli del modello di IA generativa e pubblicato una tabella per confrontare le prestazioni con quelle dei concorrenti.
Grok-1 superiore a Llama 2 e GPT-3.5
xAI sottolinea che Grok è un’intelligenza artificiale “modellata sulla Guida galattica per autostoppisti”, quindi può rispondere a qualsiasi domanda. Uno dei vantaggi del chatbot è che può accedere alle informazioni in tempo reale tramite la piattaforma X. Inoltre risponde anche a domande che vengono rifiutate dalla maggior parte degli altri sistemi di intelligenza artificiale.
Grok è basato sul modello Grok-1 sviluppato negli ultimi quattro mesi. Il prototipo Grok-0 è stato addestrato con 33 miliardi di parametri e già offriva prestazioni comparabili al modello Llama 2 di Meta (addestrato con 70 miliardi di parametri). Grok-1 ha prestazioni nettamente superiori soprattutto nelle capacità di ragionamento e codifica.
xAI ha pubblicato i risultati dei test effettuati con quattro benchmark: GSM8k (problemi matematici di scuola media), MMLU (domande multidisciplinari a scelta multipla), HumanEval (codifica di attività in Python) e MATH (problemi matematici di scuola media e superiore scritti in LaTeX).
In tutti i test, Grok-1 supera i modelli Llama 2, Inflection-1 e GPT-3.5. I modelli Palm2 (Google), Claude 2 (Anthropic) e GPT-4 (OpenAI) offrono prestazioni superiori perché sono addestrati con un numero maggiore di parametri e quindi richiedono più risorse. La “context window” di Grok-1 è 8.192 token.
xAI ha già pianificato aggiornamenti di Grok-1 per aumentare la context window, migliorare la sicurezza e aggiungere il supporto multimodale (audio, immagini e video). Al momento, Grok è accessibile ad un numero limitato di utenti negli Stati Uniti (solo quelli verificati su X possono chiedere l’iscrizione alla waitlist). In futuro sarà disponibile per gli abbonati a X Premium+.