Meta ha appena svelato i suoi nuovi modelli AI: Llama 4. Questa volta ci sono ben quattro nuovi sistemi: Scout, Maverick e Behemoth. Addestrati su enormi quantità di testi, immagini e video non etichettati, questi modelli promettono una comprensione visiva senza precedenti. E attenzione: l’hanno fatto di sabato!
A quanto pare, il successo dei modelli open source del laboratorio cinese DeepSeek ha fatto suonare l’allarme in casa Meta. I modelli R1 e V3 di DeepSeek si sono dimostrati all’altezza o addirittura superiori ai precedenti Llama di Meta, scatenando una corsa contro il tempo per decifrare il segreto del loro basso costo di esecuzione e distribuzione.
Meta svela i nuovi modelli AI Llama 4
Scout e Maverick sono già disponibili su Llama.com e attraverso i partner di Meta, come la piattaforma di sviluppo AI Hugging Face. Behemoth, invece, sta ancora sudando in palestra… Nel frattempo, Meta AI, l’assistente AI di Meta per app come WhatsApp, Messenger e Instagram, è stato aggiornato con Llama 4 in 40 paesi, anche se le funzionalità multimodali sono limitate agli USA e all’inglese per ora.
La grande novità di Llama 4 è l’uso di un’architettura MoE (mixture of experts), che promette una maggiore efficienza computazionale nell’addestramento e nelle risposte. In pratica, i compiti di elaborazione dei dati vengono suddivisi in sottocompiti e delegati a modelli “esperti” più piccoli e specializzati.
Maverick e Scout: potenza e contesto senza limiti
Maverick, il modello pensato per l’assistenza generale e le chat creative, vanta 400 miliardi di parametri totali, ma solo 17 miliardi di parametri attivi distribuiti su 128 “esperti”. Nei test interni di Meta, Maverick ha superato modelli come GPT-4o di OpenAI e Gemini 2.0 di Google in diverse prove di codifica, ragionamento, multilinguismo e contesto lungo. Tuttavia, non raggiunge ancora i livelli dei modelli più recenti e capaci come Gemini 2.5 Pro di Google, Claude 3.7 Sonnet di Anthropic e GPT-4.5 di OpenAI.
Scout, invece, eccelle nel riassumere documenti e ragionare su grandi basi di codice. La sua peculiarità? Una finestra di contesto enorme: 10 milioni di token. In parole povere, Scout può ingerire immagini e milioni di parole, permettendogli di processare e lavorare con documenti lunghissimi.
Behemoth: il gigante che sfida GPT-4.5
E poi c’è Behemoth, il modello non ancora rilasciato da Meta. Con i suoi 288 miliardi di parametri attivi, 16 esperti e quasi due trilioni di parametri totali, Behemoth richiederà un hardware ancora più muscoloso. Nei benchmark interni di Meta, Behemoth ha superato GPT-4.5, Claude 3.7 Sonnet e Gemini 2.0 Pro (ma non 2.5 Pro) in diverse valutazioni delle abilità STEM, come la risoluzione di problemi matematici.
Llama 4 con meno censure
Meta afferma di aver sintonizzato tutti i suoi modelli Llama 4 per rifiutare meno spesso di rispondere a domande “controverse“. Secondo l’azienda, Llama 4 risponde a temi politici e sociali “dibattuti” che i precedenti modelli Llama avrebbero evitato. Inoltre, sostiene Meta, Llama 4 è molto più equilibrato quando si tratta di decidere quali prompt rifiutare del tutto.
“Potete contare su Llama 4 per fornire risposte utili e fattuali senza giudizio”, ha dichiarato un portavoce di Meta a TechCrunch. “Stiamo continuando a rendere Llama più reattivo, in modo che risponda a più domande, possa rispondere a una varietà di punti di vista diversi […] e non favorisca alcune opinioni rispetto ad altre“.