Nella classifica dei chatbot AI stilata da La Large Model Systems Organization (LMSYS), GPT-4 si conferma il leader indiscusso. Questo modello, che alimenta ChatGPT Plus e Bing Chat, ha ottenuto il punteggio più alto ed è il punto di riferimento per i modelli linguistici di grandi dimensioni (LLM).
Ma la vera sorpresa arriva dai modelli Claude di Anthropic, che hanno battuto tutti i concorrenti di GPT-3.5. Questo modello, che è alla base della versione gratuita di ChatGPT, è stato superato da Claude 1, Claude 2 e Claude Instant. Questo suggerisce che tutti i principali modelli linguistici sviluppati da Anthropic possono superare la versione gratuita di ChatGPT.
Claude 2 vs GPT 3.5: qual è il migliore?
Come riportato in precedenza da Decrypt, la differenza nelle capacità di elaborazione dei token tra ChatGPT Plus e Claude Pro, pur non essendo un fattore nella classifica LMSYS, rappresenta un vantaggio significativo dei modelli Claude rispetto a GPT. Claude Pro, basato sul modello LLM Claude 2, può elaborare fino a 100.000 token di informazioni. Invece, ChatGPT Plus, basato sul modello LLM GPT-4, gestisce 8.192 token.
Questa differenza significativa nella capacità di elaborazione dei token evidenzia il vantaggio dei modelli Claude nella gestione di input contestuali estesi. Questo è essenziale per offrire un’esperienza utente più ricca e ricca di sfumature.
Anche nell’elaborazione di query più lunghe, Claude 2 ha dimostrato la sua superiorità rispetto a GPT, elaborando in modo più efficiente le query più grandi. Tuttavia, quando le query sono di dimensioni comparabili, Claude 1 e Claude Instant producono risultati simili, o addirittura leggermente migliori, di quelli di GPT-3.5. Ciò lascia spazio alla competitività tra questi modelli.
Grazie alle loro capacità contestuali, i modelli Claude sono in grado di migliorare notevolmente una risposta inizialmente errata utilizzando una query più elaborata, più ampia e più dettagliata.
Dove si collocano i modelli open source in questa competizione
WizardLM, un modello basato su LlaMA-2 di Meta con 70 miliardi di parametri, si distingue come il miglior modello di linguaggio naturale (LLM) open source. È seguito da vicino da Vicuna 33B e dall’originale LlaMA-2, pubblicato da Meta.
I modelli open source svolgono un ruolo essenziale nel progresso dell’intelligenza artificiale per una serie di motivi. In primo luogo, offrono la possibilità di un uso locale. Ciò significa che gli utenti possono personalizzarli per soddisfare le loro esigenze specifiche. Allo stesso tempo, incoraggiano la collaborazione all’interno della comunità per migliorarli collettivamente.
Inoltre, grazie alle licenze, sono generalmente più convenienti da gestire. Questo spiega perché esistono così tanti modelli di linguaggio naturale open source. In altre parole, sistemi che si oppongono ai modelli proprietari. Man mano che i chatbot diventano indispensabili in diversi settori, dal servizio clienti agli assistenti personali, la loro efficienza, adattabilità e precisione diventano fondamentali.
Con i modelli Claude che superano GPT-3.5 e GPT-4, le aziende e i singoli utenti possono trovarsi di fronte alla difficile scelta del modello più adatto alle loro esigenze. Per gli appassionati, questo potrebbe sembrare un semplice aggiornamento delle classifiche, ma per coloro che osservano da vicino il settore dell’IA, illustra la feroce competizione tra Claude e ChatGPT.
Per coloro che si trovano in una posizione intermedia, è un promemoria del fatto che nell’IA il modello più popolare di oggi potrebbe rapidamente cedere il passo a uno più efficiente ed efficace. Le dinamiche di questo settore sono in continuo mutamento, il che rende interessante seguirne l’evoluzione.