Già sappiamo che Microsoft introdurrà GPT-4 questa settimana, portando al pubblico la nuova generazione del language model sviluppato da OpenAI con nuove potenzialità non indifferenti. Su tutte, conferma l’azienda statunitense con altre dichiarazioni recenti, spicca la capacità di trasformare i testi in video.
GPT-4 sarà un modello multimodale
Il CTO di Microsoft Germania, Andreas Braun, proprio lo scorso weekend ha chiarito nuovamente alla stampa tedesca interessata al mondo tech che GPT-4 sarà decisamente più potente rispetto a GPT-3, iterazione del Generative Pre-trained Transformer dietro la stessa ChatGPT. Non soltanto sarà capace di trasformare testi input testuali in immagini come ora fanno Midjourney e DALL-3, ma consentirà la realizzazione di file audio e video a partire da una semplice stringa di parole.
Questo rapido progresso sarebbe stato possibile anche grazie agli incredibili investimenti da parte di Microsoft: secondo gli ultimi report, Satya Nadella e soci avrebbero deciso di dedicare oltre 10 miliardi di dollari alla società madre di GPT, OpenAI, ottenendo in cambio una partnership strategica per portare lo stesso strumento su Bing che, per alcune aziende, starebbe in realtà già utilizzando GPT-4 e non la tanto chiacchierata GPT-3.5.
Purtroppo Andreas Braun non ha aggiunto altre informazioni succose riguardanti GPT-4 o l’evoluzione del chatbot su Bing. Del resto, è giusto che mantenga alcuni segreti in vista dell’imminente presentazione del modello linguistico autoregressivo potenziato dal deep learning di ultima generazione. Evitando di cadere nella trappola dei rumor, non ci resta che attendere la dimostrazione ufficiale per scoprire le capacità di questa intelligenza artificiale.