Microsoft ha avviato i test per una nuova funzionalità di Bing Chat. Alcuni utenti nel mondo possono sfruttare il riconoscimento delle immagini del modello GPT-4 e chiedere al chatbot di identificare il soggetto/oggetto nella foto. Altre interessanti novità arriveranno nelle prossime settimane.
Bing Chat riconosce le immagini
Come è noto, il modello GPT-4 di OpenAI è multimodale, quindi anche Bing Chat (che usa una versione custom di GPT-4) supporta diversi tipi di input. Oltre che testo e voce, l’utente può usare un’immagine e chiedere al chatbot di descrivere il contenuto. Il test è attualmente in corso. I più fortunati vedranno una nuova icona nel campo di testo, accanto a quella del microfono.
Cliccando sull’icona è possibile caricare l’immagine. Nell’esempio condiviso su Twitter da un utente, Bing Chat riconosce il Tempio di Edfu in Egitto:
Oh, how cool is that! Just noticed that I have access to #Bing chat's image features! @MParakhin reading German text from images needs some work. ☺️ #ai pic.twitter.com/04JfV66PAL
— Karsten Lehmann (@Klehmann79) June 23, 2023
Mikhail Parakhin, responsabile del gruppo Advertising and Web Services di Microsoft, ha confermato l’avvio dei test per il 10% circa degli utenti desktop. La nuova funzionalità sarà disponibile per tutti nelle prossime settimane (anche su Android e iOS). Questa importante novità verrà inclusa anche in Windows Copilot.
Un altro utente ha caricato lo screenshot dell’equazione di Schrodinger che il chatbot ha riconosciuto perfettamente, fornendo anche una descrizione dettagliata:
Testing the Bing Vision/GPT-4 Vision
Input: A image of the “Schrödinger equation”Bing: https://t.co/vsSUdHe26q pic.twitter.com/9WfZHbwcG4
— 𝑨𝒓𝒕𝒊𝒇𝒊𝒄𝒊𝒂𝒍 𝑮𝒖𝒚 (@artificialguybr) June 21, 2023
Il dirigente dell’azienda di Redmond ha inoltre annunciato l’avvio dei test per la funzionalità che consente a Bing di “leggere” documenti di lunghezza arbitraria. Il test relativo al supporto per altri browser (al momento è possibile usare solo Edge) è stato invece temporaneamente sospeso per risolvere alcuni bug, soprattutto con Safari.