Un brevetto recentemente pubblicato dall’US Patent and Trademark Office (USPTO) il 10 ottobre 2024 rivela che Microsoft sta lavorando a una funzione inedita per Copilot. Il documento di 20 pagine, depositato originariamente il 5 aprile dell’anno precedente, descrive un sistema in grado di convertire l’audio in immagini generate dall’intelligenza artificiale.
Il funzionamento di questa tecnologia è piuttosto affascinante. Durante le riunioni o le conferenze, il sistema cattura la voce dei partecipanti tramite un microfono e la trasforma istantaneamente in testo. Il testo viene poi segmentato in frasi e ogni segmento viene sintetizzato da un modello linguistico per creare prompt per la generazione di immagini.
Microsoft brevetta tecnologia Copilot per immagini live da audio
Microsoft prevede di distribuire questa funzione principalmente su Teams. Le immagini generate dall’intelligenza artificiale saranno visualizzate in tempo reale su uno schermo e cambieranno con il progredire della conversazione. Così, quando l’oratore cambia argomento, le illustrazioni si adattano automaticamente, fornendo un supporto visivo dinamico e pertinente.
L’azienda spiega la sua visione: “Quando le immagini integrano la comunicazione verbale, chiariscono i concetti e li rendono più facili da capire, il che è particolarmente vantaggioso per le persone che imparano meglio con gli aiuti visivi“.
Il futuro di Microsoft Copilot
Se ci si sta chiedendo se la funzione sarà lanciata a breve, la risposta è molto probabilmente no. Il deposito di un brevetto e la produzione di un prodotto o lo sviluppo di una funzione è in realtà un percorso lungo. Molti brevetti, infatti, non arrivano mai alla fase di produzione e rimangono un’idea.
Tuttavia, se Microsoft decidesse di lanciare questa funzione, probabilmente sarebbe inserita in Microsoft Teams, la sua piattaforma di videoconferenza, e sarebbe accessibile attraverso il suo componente aggiuntivo AI, Copilot, come Copilot Pro o Microsoft 365 Copilot per le aziende.