Nuovi modelli GPT: aumenta la confusione dei nomi

Nuovi modelli GPT: aumenta la confusione dei nomi

Il lancio dei nuovi modelli GPT-4.1 ha incrementato la confusione dei nomi che il CEO Sam Altman promette di risolvere entro l'estate.
Nuovi modelli GPT: aumenta la confusione dei nomi
Il lancio dei nuovi modelli GPT-4.1 ha incrementato la confusione dei nomi che il CEO Sam Altman promette di risolvere entro l'estate.

OpenAI ha annunciato tre nuovi modelli della serie GPT-4.1 dedicati principalmente alla programmazione. Offrono prestazioni superiori a GPT-4o e GPT-4o mini in diversi compiti, ma saranno accessibili esclusivamente agli sviluppatori. L’azienda californiana ha inoltre deciso di ritirare GPT-4.5. Il CEO Sam Altman ha promesso di semplificare i nomi entro l’estate.

Troppi modelli e troppi nomi

OpenAI sviluppa due famiglie di modelli: GPT e o. Finora ai nuovi modelli è stato assegnato un numero crescente per indicare capacità e prestazioni superiori a quelle della precedente generazione. GPT-4.5 è stato annunciato a fine febbraio, in attesa di GPT-5. È disponibile agli sviluppatori tramite API. L’azienda californiana ha comunicato il ritiro entro il 14 luglio, quando verrà sostituito da GPT-4.1.

Il modello GPT-4.5 sarà ancora accessibile tramite ChatGPT agli abbonati (che non potranno usare le tre versioni di GPT-4.1). Sam Altman aveva comunicato che GPT-4.5 sarebbe stato l’ultimo modello senza capacità di ragionamento. Il lancio di GPT-4.1 conferma che i piani sono cambiati. Gli utenti non abbonati possono invece utilizzare GPT-4o tramite ChatGPT.

Il nuovo modello GPT-4.1 non è superiore a GPT-4.5 in ogni compito (ciò spiegherebbe il numero inferiore), ma è più veloce e meno costoso. I miglioramenti introdotti con GPT-4.1 verranno gradualmente aggiunti a GPT-4o, l’unico accessibile a tutti gli utenti (abbonati e non).

Sam Altman ha promesso che il problema dei nomi verrà risolto entro l’estate. Fino ad allora ci saranno due rami distinti. Uno riguarda i modelli riservati agli sviluppatori e accessibili tramite API, mentre l’altro riguarda i modelli disponibili tramite ChatGPT che verranno aggiornati con capacità derivate dai “research model”.

Fonte: Ars Technica
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
15 apr 2025
Link copiato negli appunti