Progettato fin dalle sue fondamenta per essere multimodale, Gemini è il nuovo e più grande modello IA messo a punto da Google. L’annuncio ufficiale di oggi, in occasione dell’esordio, ribadisce quanto già emerso in precedenza e le ambizioni di bigG inerenti all’ambito dell’intelligenza artificiale.
Google presenta Gemini, il suo modello IA più avanzato
Quali sono le sue potenzialità? È in grado di generalizzare, comprendere, operare e combinare senza discontinuità diverse tipologie di informazioni: dai testi alle immagini, dagli audio ai video, fino al codice.
I test condotti fanno riferimento a prestazioni superiori rispetto a quelle dei migliori modelli in circolazione, per 30 dei 32 benchmark accademici di settore utilizzati nell’ambito LLM (Large Language Model).
Un modello, tre versioni: Ultra, Pro e Nano
Il gruppo di Mountain View ha reso noto che la prima versione è ottimizzata per tre dimensioni differenti.
- Ultra, il modello più grande e potente, per compiti altamente complessi;
- Pro, il modello migliore per essere applicato su scala a un’ampia gamma di attività;
- Nano, il modello più efficiente per attività da svolgere su un singolo dispositivo (on-device).
Stando a quanto dichiarato da bigG, le capacità di Gemini torneranno utili, in particolare, nel far emergere conoscenze che possono essere difficili da individuare all’interno di una grande quantità di dati. Un punto di forza, questo, che secondo Google contribuirà ad accelerare l’innovazione in molti campi, dalla scienza alla finanza. In un certo senso, è la sintesi perfetta delle ambizioni di Google nel campo IA.
L’annuncio pone l’accento anche sul tema della sicurezza. Il team al lavoro sul progetto afferma di aver condotto ricerche mirate e di aver applicato tecniche di adversial testing per identificare problemi critici e per implementare gli accorgimenti necessari a contrastare il fenomeno dei pregiudizi impliciti (bias). Ci sarà tempo per verificarlo.
La disponibilità
Quando sarà possibile mettere alla prova Gemini? Fin da subito, in 170 paesi di tutto il mondo, anche se inizialmente solo con supporto per la lingua inglese. Google afferma che il rollout è già stato avviato e che l’implementazione del modello è immediata in diversi prodotti e piattaforme del gruppo. Uno di questi è il chatbot Bard.
Gemini Nano verrà inoltre integrato nello smartphone Pixel 8 Pro, eseguito in locale per aiutare l’utente in operazioni come la creazione di riassunti nell’app Recorder e nella stesura di risposte automatiche in WhatsApp, passando dalla tastiera Gboard. Entro i prossimi mesi arriverà anche su Chrome, Ads, nel motore di ricerca e in Duet.