Gemini di Google, nuova versione supera GPT-4o di OpenAI

Gemini di Google, nuova versione supera GPT-4o di OpenAI

Il nuovo modello sperimentale Gemini di Google ha ottenuto punteggi migliori di GPT-4 di OpenAI nei test comparativi di Chatbot Arena.
Gemini di Google, nuova versione supera GPT-4o di OpenAI
Il nuovo modello sperimentale Gemini di Google ha ottenuto punteggi migliori di GPT-4 di OpenAI nei test comparativi di Chatbot Arena.

Google lancia il guanto di sfida a OpenAI, con un nuovo modello Gemini sperimentale che fa scintille. Si chiama Gemini-Exp-1114 e ha appena spodestato GPT-4o di OpenAI dalla vetta della classifica di Chatbot Arena, una piattaforma dove i modelli di intelligenza artificiale si sfidano a colpi di voti della community. Gemini-Exp-1114 ha stracciato la concorrenza con oltre 6.000 voti in una settimana.

Gemini di Google supera GPT-4o di OpenAI nei test di Chatbot Arena

L’ultima versione di Gemini ha fatto un notevole balzo in avanti, guadagnando punti su punti e superando persino il chiacchierato o1-preview di OpenAI. Insomma, saremmo di fronte a un vero e proprio fuoriclasse.

Gemini-Exp-1114 eccelle in diverse categorie, come matematica, scrittura creativa, prompt complessi, ecc. E ha conquistato anche la medaglia di bronzo nel coding e nei prompt con controllo dello stile, battuto solo da o1-preview di OpenAI. Se confrontato con altri modelli comparabili, Gemini vince al 50% rispetto a GPT-4o-latest, al 56% rispetto a o1-preview e al 62% rispetto a Claude-3.5-Sonnet.

Disponibilità per sviluppatori e tramite API

La serie Gemini 1.5 di settembre era stata già migliorata per ottenere un aumento di circa il 7% in MMLU-Pro, di circa il 20% nei benchmark MATH e HiddenMath e del 2-7% nei casi d’uso della visione e codice. Ma con Gemini-Exp-1114 siamo di fronte a un vero e proprio salto quantico. Le risposte sono più precise, più concise e persino più brevi del 5-20%.

Gli sviluppatori non dovranno aspettare un’eternità per metterci le mani sopra, e possono già testarlo in Google AI Studio e presto sarà disponibile anche tramite API.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
15 nov 2024
Link copiato negli appunti