Con la modalità vocale avanzata, OpenAI ha permesso a tutti gli utenti, compresi quelli gratuiti, di conversare naturalmente con l’assistente AI. Questa funzionalità, mostrata durante l’annuncio di GPT-4o a maggio 2024, includeva anche una capacità di visione.
Secondo le stringhe di codice individuate nell’ultima build beta di ChatGPT v1.2024.317, le funzionalità di visione dal vivo potrebbero essere pronte per una beta più ampia. Queste stringhe suggeriscono che OpenAI abbia lavorato intensamente sulla modalità vocale avanzata con visione per prepararla alla distribuzione.
La modalità vocale avanzata di ChatGPT con la funzione di visione dal vivo
Durante l’annuncio di GPT-4o, OpenAI ha presentato la modalità vocale avanzata con capacità di visione. ChatGPT ha riconosciuto senza problemi il soggetto ripreso dalla telecamera, ricordandone il nome, identificando una palla e associandola a un cane. Questa demo ha mostrato come il chatbot possa fornire risposte precise anche senza avere molte informazioni in possesso.
Alcuni fortunati alpha tester hanno già provato la funzione ChatGPT Live Video (Vision) e hanno riportato risultati positivi. La funzione ha funzionato perfettamente, risultando estremamente utile nelle interazioni.
La nuova funzione potrebbe chiamarsi Live Camera
Le stringhe individuate nell’ultima build beta di ChatGPT suggeriscono che la funzione potrebbe chiamarsi “Live Camera” al momento della distribuzione agli utenti beta. Android Authority ha scovato alcune stringhe che avvertono di non usare “Live Camera” per la navigazione in diretta o per decisioni che riguardano salute o sicurezza.
Tuttavia, lasciano pensare che la funzione sia pronta per un’implementazione più ampia. Presto quindi potrebbe essere disponibile per ChatGPT Plus e per gli abbonati a pagamento dell’assistente AI.