La software house norvegese ha annunciato due importanti novità per il suo chatbot integrato nelle varie versioni del browser. Opera Aria permette ora di generare le immagini a partire da un input testuale e può leggere le risposte a voce alta. Queste novità sono al momento disponibili agli sviluppatori tramite Opera Developer. Gli utenti possono testare Aria in Opera One (desktop e mobile). In futuro potranno scegliere tra oltre 150 modelli.
Nuovo AI Feature Drops
Le novità fanno parte del programma AI Feature Drops, avviato all’inizio di marzo, che prevede il rilascio di funzionalità sperimentali basate sull’intelligenza artificiale generativa per Opera One. L’accesso è riservato agli sviluppatori che forniranno i feedback prima della distribuzione generale.
La software house sfrutta i modelli GPT di OpenAI per le normali conversazioni. Per la generazione delle immagini viene utilizzato il modello Imagen 2 di Google. L’utente deve inserire un prompt (input) specificando l’intenzione di generare un’immagine e aggiungendo una descrizione testuale, ad esempio “Crea un’immagine di un cane in vacanza sulla spiaggia mentre beve un drink“.
Se l’immagine non è quella desiderata è possibile rigenerarla cliccando sul terzo pulsante mostrato in alto a destra. È quindi possibile chiedere ad Aria di modificare l’immagine, senza ripetere il prompt completo. C’è tuttavia il limite di 30 immagini al giorno.
La seconda funzionalità è utile soprattutto per gli utenti con problemi visivi. Cliccando sul primo pulsante in alto a destra, il chatbot legge il testo della risposta a voce alta. In questo caso viene utilizzata la versione base del modello Wavenet di Google. Opera Aria è accessibile dalla barra laterale o linea di comando (Ctrl + / o Cmd + /).