Perché OpenAI rimanda il lancio della modalità vocale di ChatGPT

Perché OpenAI rimanda il lancio della modalità vocale di ChatGPT

OpenAI posticipa il rilascio della modalità vocale per ChatGPT. Prevista inizialmente a giugno, la distribuzione slitta a luglio per problemi tecnici.
Perché OpenAI rimanda il lancio della modalità vocale di ChatGPT
OpenAI posticipa il rilascio della modalità vocale per ChatGPT. Prevista inizialmente a giugno, la distribuzione slitta a luglio per problemi tecnici.

OpenAI sposticipa il lancio della nuova Modalità vocale avanzata di ChatGPT, adducendo la necessità di ulteriori miglioramenti. L’azienda aveva previsto il lancio di questa funzione per un piccolo gruppo di utenti di ChatGPT Plus alla fine di giugno, ma ora dice di aver bisogno di un altro mese per soddisfare i suoi standard.

OpenAI posticipa la modalità vocale di ChatGPT: priorità a sicurezza e user experience

La nuova modalità vocale avanzata, alimentata dal modello GPT-4o, dovrebbe avvicinare le chat conl’AI al dialogo umano naturale. Quando è stata presentata il mese scorso all’evento Spring Update di OpenAI, la funzione ha mostrato la capacità di comprendere e rispondere alle emozioni e ai segnali non verbali. Ha anche dimostrato una velocità impressionante, con tempi di risposta di soli 232 millisecondi.

Il ritardo deriva dal lavoro in corso su due aree chiave: la sicurezza e l’esperienza dell’utente. OpenAI vuole migliorare la capacità del modello di rilevare e rifiutare alcuni tipi di contenuti, in modo da evitare abusi e garantire interazioni responsabili con l’AI. Si sta inoltre concentrando sul miglioramento dell’esperienza utente e sulla preparazione dei sistemi a gestire milioni di utenti mantenendo le risposte in tempo reale.

All’inizio del mese l’azienda guidata da Sam Altman, Microsoft e Oracle hanno annunciato una partnership che permetterà a OpenAI di sfruttare OCI per estendere la piattaforma Microsoft Azure AI. Questo probabilmente avrà un ruolo importante nel contribuire a fornire la capacità necessaria per scalare l’accesso ai loro modelli.

L’approccio prudente di OpenAI

Nonostante la battuta d’arresto, OpenAI prevede di iniziare con un piccolo gruppo di test alfa e di espandersi gradualmente in base al feedback. L’azienda prevede comunque che tutti gli utenti di ChatGPT Plus avranno accesso entro l’autunno, anche se le tempistiche esatte dipendono dal rispetto dei parametri di sicurezza e affidabilità.

Questo approccio prudente è in linea con la crescente consapevolezza del settore sulla necessità di uno sviluppo responsabile dell’AI. Man mano che i sistemi di AI diventano sempre più avanzati e simili a quelli umani, garantire che operino in modo sicuro ed etico diventa sempre più cruciale.

Le nuove funzionalità multimodali di GPT-4o

ChatGPT utilizza già il nuovo modello multimodale GPT-4o, ma ha accesso solo alle immagini. OpenAI ha dichiarato che rilascerà separatamente le funzionalità di condivisione di video e schermo, ma non ha fornito tempistiche specifiche.

Nonostante il disappunto di alcuni utenti per il posticipo, la scelta di OpenAI di prendersi più tempo prima del lancio è comprensibile. L’attenzione per la messa a punto della modalità vocale e delle funzionalità multimodali mira a garantire un’esperienza più curata e sicura quando queste novità arriveranno.

Prendendosi il tempo necessario per migliorare la sicurezza e l’user experience, OpenAI punta a offrire un prodotto di qualità, limitando potenziali abusi e interazioni negative con l’AI conversazionale. Si spera che la pazienza degli utenti verrà ripagata con un’esperienza vocale avanzata all’altezza delle aspettative.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
26 giu 2024
Link copiato negli appunti