OpenAI sposticipa il lancio della nuova Modalità vocale avanzata di ChatGPT, adducendo la necessità di ulteriori miglioramenti. L’azienda aveva previsto il lancio di questa funzione per un piccolo gruppo di utenti di ChatGPT Plus alla fine di giugno, ma ora dice di aver bisogno di un altro mese per soddisfare i suoi standard.
We're sharing an update on the advanced Voice Mode we demoed during our Spring Update, which we remain very excited about:
We had planned to start rolling this out in alpha to a small group of ChatGPT Plus users in late June, but need one more month to reach our bar to launch.…
— OpenAI (@OpenAI) June 25, 2024
OpenAI posticipa la modalità vocale di ChatGPT: priorità a sicurezza e user experience
La nuova modalità vocale avanzata, alimentata dal modello GPT-4o, dovrebbe avvicinare le chat conl’AI al dialogo umano naturale. Quando è stata presentata il mese scorso all’evento Spring Update di OpenAI, la funzione ha mostrato la capacità di comprendere e rispondere alle emozioni e ai segnali non verbali. Ha anche dimostrato una velocità impressionante, con tempi di risposta di soli 232 millisecondi.
Il ritardo deriva dal lavoro in corso su due aree chiave: la sicurezza e l’esperienza dell’utente. OpenAI vuole migliorare la capacità del modello di rilevare e rifiutare alcuni tipi di contenuti, in modo da evitare abusi e garantire interazioni responsabili con l’AI. Si sta inoltre concentrando sul miglioramento dell’esperienza utente e sulla preparazione dei sistemi a gestire milioni di utenti mantenendo le risposte in tempo reale.
All’inizio del mese l’azienda guidata da Sam Altman, Microsoft e Oracle hanno annunciato una partnership che permetterà a OpenAI di sfruttare OCI per estendere la piattaforma Microsoft Azure AI. Questo probabilmente avrà un ruolo importante nel contribuire a fornire la capacità necessaria per scalare l’accesso ai loro modelli.
L’approccio prudente di OpenAI
Nonostante la battuta d’arresto, OpenAI prevede di iniziare con un piccolo gruppo di test alfa e di espandersi gradualmente in base al feedback. L’azienda prevede comunque che tutti gli utenti di ChatGPT Plus avranno accesso entro l’autunno, anche se le tempistiche esatte dipendono dal rispetto dei parametri di sicurezza e affidabilità.
Questo approccio prudente è in linea con la crescente consapevolezza del settore sulla necessità di uno sviluppo responsabile dell’AI. Man mano che i sistemi di AI diventano sempre più avanzati e simili a quelli umani, garantire che operino in modo sicuro ed etico diventa sempre più cruciale.
Le nuove funzionalità multimodali di GPT-4o
ChatGPT utilizza già il nuovo modello multimodale GPT-4o, ma ha accesso solo alle immagini. OpenAI ha dichiarato che rilascerà separatamente le funzionalità di condivisione di video e schermo, ma non ha fornito tempistiche specifiche.
Nonostante il disappunto di alcuni utenti per il posticipo, la scelta di OpenAI di prendersi più tempo prima del lancio è comprensibile. L’attenzione per la messa a punto della modalità vocale e delle funzionalità multimodali mira a garantire un’esperienza più curata e sicura quando queste novità arriveranno.
Prendendosi il tempo necessario per migliorare la sicurezza e l’user experience, OpenAI punta a offrire un prodotto di qualità, limitando potenziali abusi e interazioni negative con l’AI conversazionale. Si spera che la pazienza degli utenti verrà ripagata con un’esperienza vocale avanzata all’altezza delle aspettative.