Chatbot Arena, Gemini di Google è il primo in classifica

Chatbot Arena, Gemini di Google è il primo in classifica

Il nuovo modello sperimentale Gemini-Exp-1206 di Google è diventato il chatbot numero 1 nella classifica Chatbot Arena, superando GPT 4o.
Chatbot Arena, Gemini di Google è il primo in classifica
Il nuovo modello sperimentale Gemini-Exp-1206 di Google è diventato il chatbot numero 1 nella classifica Chatbot Arena, superando GPT 4o.

Ormai è chiaro: la battaglia per il dominio dell’intelligenza artificiale si gioca tutta tra Google e OpenAI. Le loro creazioni, i modelli di linguaggio di grandi dimensioni, si contendono a suon di aggiornamenti il primato nella famosa classifica Chatbot Arena.

Fino a poco fa, era GPT-4o di OpenAI a guidare la classifica di Chatbot Arena. Ma il nuovo arrivato in casa Google, Gemini-Exp-1206, ha rimescolato le carte in tavola. Il modello sperimentale appena rilasciato ha già scalzato il modello di OpenAI dal trono.

Gemini-Exp-1206, il chatbot di Google è il migliore secondo Chatbot Arena

Gemini-Exp-1206 non si accontenta di essere il numero uno in classifica generale. Il modello di Google primeggia in ben 8 categorie su 10. Solo nel coding è a pari merito con o1 di OpenAI.

La buona notizia è che chiunque può testare le capacità di Gemini-Exp-1206. Il modello è già disponibile sia su Google AI Studio che tramite le API Gemini per gli sviluppatori. Insomma, Google ha deciso di condividere subito con il mondo il suo gioiellino.

Meta non sta a guardare: arriva Llama 3.3

Neanche il tempo di celebrare il trionfo di Google, che Meta risponde con Llama 3.3 70B. Questo modello open-source promette prestazioni da top di gamma per le applicazioni di elaborazione del testo, ma a un costo di inferenza molto più basso rispetto ai concorrenti “chiusi”.

Grazie a tecniche innovative di allineamento e apprendimento per rinforzo, Llama 3.3 70B riesce a offrire le stesse prestazioni del “fratello maggiore” Llama 3.1 405B, ma può girare anche su comuni workstation. Meta ha già reso disponibile Llama 3.3 su Hugging Face e presto arriverà anche su Azure e altre piattaforme cloud.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
9 dic 2024
Link copiato negli appunti