Google continua ad aggiornare Gemini Flash, il modello di intelligenza artificiale generativa introdotto a metà maggio. Gli sviluppatori possono ora utilizzare la variante 1.5-8B (tramite Google AI Studio e Gemini API) che offre maggiori prestazioni ad un costo inferiore rispetto alla variante base.
Gemini Flash 1.5-8B in dettaglio
Google offre quattro modelli Gemini: Ultra, Pro, Flash e Nano (in ordine di dimensione). Gemini Flash è diventato presto uno dei più popolari, grazie all’ottima combinazione di prestazioni, dimensioni e costo. È disponibile su web e mobile in oltre 40 lingue e oltre 230 paesi.
A fine luglio è stata incrementata la “context window” da 8K a 32K token. Ciò significa che può gestire conversazioni più lunghe e rispondere a domande più complesse. Gemini Flash 1.5 può essere anche sfruttato per generare riassunti, aggiungere sottotitoli ai video e didascalie alle immagini, estrarre e analizzare informazioni da documenti e tabelle, effettuare traduzioni.
La variante 1.5-8B ha 8 miliardi di parametri, come si deduce dal nome. Anche se più piccolo offre prestazioni quasi identiche a quelle del modello 1.5 originario (la versione aggiornata a settembre è superiore) nell’elaborazione di testo, immagini, audio e video, nei calcoli matematici, nella generazione di codice, nella traduzione del testo e nella capacità di ragionamento.
Google ha inoltre ridotto la latenza (tempo di risposta a domande semplici) e raddoppiato il numero di richieste al minuto (da 2.000 a 4.000) rispetto al modello base. Questi sono i prezzi che verranno applicati dal 14 ottobre:
È possibile accedere al modello gratuitamente tramite Gemini API, ma c’è il limite sul numero di richieste: 15 al minuto e 1.500 al giorno.