Gemma 2, l’ultima versione della famiglia di modelli open-source di Google, è ora disponibile per ricercatori e sviluppatori di tutto il mondo. L’azienda ha rilasciato il modello in due varianti: 9 miliardi e 27 miliardi di parametri. Ecco la relazione tecnica.
La famiglia Gemma si allarga con varianti specializzate
All’inizio di quest’anno, Google ha introdotto la famiglia Gemma di modelli aperti leggeri e all’avanguardia, basandosi sulla stessa ricerca e tecnologia utilizzata per creare i modelli Gemini. Da allora la famiglia si è ampliata con varianti come CodeGemma, RecurrentGemma e PaliGemma, ognuna delle quali è stata adattata a compiti specifici di AI. Con Gemma 2, che Google ha annunciato per la prima volta il mese scorso, l’azienda si spinge ancora più in là.
Il modello 27B, in particolare, offre prestazioni competitive con modelli proprietari di dimensioni più che doppie, un’impresa impensabile solo sei mesi fa. Si avvicina alle prestazioni di modelli più grandi come Llama 3 70B e Claude 3 Sonnet, pur essendo significativamente più piccolo.
Prestazioni competitive con modelli proprietari di dimensioni doppie
Uno degli aspetti più sorprendenti di Gemma 2 è la sua efficienza. Google sostiene che il modello 27B può essere eseguito con la massima precisione su un singolo host Google Cloud TPU, GPU NVIDIA A100 80GB Tensor Core o GPU NVIDIA H100 Tensor Core. Questo riduce significativamente i requisiti hardware e i costi associati all’implementazione di modelli AI così potenti. Questa efficienza non va a scapito della velocità: Gemma 2 è ottimizzato per una rapida inferenza su un’ampia gamma di hardware, dalle configurazioni cloud di fascia alta ai laptop da gioco di fascia consumer.
Un’opportunità per sviluppatori e ricercatori
Per gli sviluppatori e i ricercatori, Gemma 2 è sicuramente da prendere in considerazione. È rilasciato con una licenza di tipo commerciale, che consente sia la ricerca che la potenziale monetizzazione delle innovazioni costruite su di esso. Il modello è progettato per un’ampia compatibilità, integrandosi perfettamente con framework AI popolari come Hugging Face Transformers, JAX, PyTorch e TensorFlow.
Gemma 2 è già disponibile in Google AI Studio ed è in arrivo nel Vertex AI Model Garden. È inoltre possibile scaricare i pesi dei modelli di Gemma 2 da Kaggle e Hugging Face Models.