Meta ha presentato la versione 3.1 della sua impressionante famiglia di modelli linguistici open-source (qui il documento di ricerca). Sebbene la parola “rivoluzionario” sia usata troppo spesso nel linguaggio odierno, non è certo un’iperbole affermare che Llama 3.1 rappresenta un grande salto nello sviluppo dell’AI. Gli sviluppatori possono scaricare il modello su Hugging Face.
Llama 3.1 di Meta, il più grande modello AI open source con 405B parametri
Llama 3.1 introduce diversi miglioramenti degni di nota:
- Modello di parametri 405B: Il più grande modello di AI open-source fino ad oggi, in grado di eseguire compiti complessi di conoscenza generale, ragionamento e traduzione multilingue.
- Finestra di contesto da 128K: Un aggiornamento significativo che consente al modello di elaborare quantità molto maggiori di informazioni in un singolo prompt.
- Supporto multilingue: Supporto migliorato per otto lingue, tra cui inglese, francese, tedesco, hindi, italiano, portoghese e spagnolo.
- Distillazione del modello e generazione di dati sintetici: Nuove funzionalità che consentono agli sviluppatori di utilizzare i risultati dei modelli Llama per migliorare altri modelli, favorendo l’innovazione e riducendo i costi.
Llama 3.1 batte GPT-4 e Claude 3.5 Sonnet
La famiglia Llama 3.1, guidata dalla versione 405B, vanta capacità impressionanti che rivaleggiano – e in alcuni benchmark superano – i modelli proprietari di alto livello di giganti del settore come OpenAI e Anthropic. L’audace affermazione di Meta, secondo cui Llama 3.1 405B è in grado di competere con GPT-4 e Claude 3.5 Sonnet in diversi compiti, segnala un potenziale cambiamento nella dinamica di potenza dell’AI.
“A partire da oggi, l’open source apre la strada“, ha dichiarato Meta in un post sui social media, sottolineando la visione dell’azienda per un futuro dell’AI più accessibile. La release include modelli aggiornati con parametri 8B e 70B, tutti caratterizzati da un supporto multilingue esteso a otto lingue e da una finestra di contesto estesa a 128K – miglioramenti che ampliano in modo significativo l’utilità e la portata dei modelli.
L’AI nel segno dell’open-source
L’addestramento di Llama 3.1 405B non è stato un’impresa da poco: ha richiesto oltre 16.000 GPU NVIDIA H100 e l’elaborazione di più di 15 trilioni di token.
Mark Zuckerberg, CEO di Meta, ha spiegato la filosofia dell’azienda in una lettera aperta, facendo un parallelo tra l’impatto potenziale dell’AI open-source e il ruolo trasformativo di Linux nell’informatica aziendale. “Credo che l’AI si svilupperà in modo simile“, ha scritto Zuckerberg, prevedendo che il rilascio di Llama 3.1 segnerà “un punto di di non ritorno nel settore in cui la maggior parte degli sviluppatori inizierà a utilizzare principalmente l’open source“.
Per supportare il rilascio di Llama 3.1 e favorirne l’adozione su larga scala, Meta ha messo insieme una serie impressionante di partner. Pesi massimi del settore come AWS, NVIDIA, Databricks, Groq, Dell, Azure e Google Cloud offrono servizi fin dal primo giorno. Queste collaborazioni mirano a fornire agli sviluppatori l’accesso immediato alle capacità avanzate di Llama 3.1, che consentono di eseguire qualsiasi cosa, dall’inferenza in tempo reale alla generazione di dati sintetici.
Llama Guard 3 e Prompt Guard: Meta punta sulla sicurezza dell’AI
Il rilascio di Llama 3.1 è accompagnato da una suite di strumenti e framework progettati per promuovere uno sviluppo responsabile dell’AI. Tra questi, Llama Guard 3, un modello di sicurezza multilingue, e Prompt Guard, un filtro contro gli attacchi di tipo prompt injection. Meta sta anche sollecitando un feedback sulla proposta di “Llama Stack”, un insieme standardizzato di interfacce volte a migliorare l’interoperabilità nell’ecosistema dell’AI.
Llama 3.1 di Meta in arrivo su Instagram e Facebook nelle prossime settimane
Con il lancio di Llama 3.1, Meta lo sta integrando nei propri prodotti. Gli utenti statunitensi possono già sperimentare le capacità del modello attraverso WhatsApp e Meta.ai, mentre nelle prossime settimane è prevista l’integrazione su Instagram, Facebook e persino ai visori Quest.
Llama 3.1 è stato accolto a braccia aperte. Grazie alla sua portata senza precedenti e alla natura open-source, questa release ha il potenziale per accelerare l’innovazione in tutto il settore, dalla ricerca accademica alle applicazioni commerciali.