Mistral AI e NVIDIA hanno rilasciato Mistral NeMo 12B, un nuovo modello linguistico destinato alle aziende. Il modello si distingue per la sua abilità nel condurre conversazioni complesse che prevedono più turni di domanda e risposta, nello svolgere calcoli matematici, nel ragionare in modo logico e razionale, nel dimostrare conoscenza generale del mondo e nel generare codice informatico.
Questo modello di AI è stato progettato specificamente per essere utilizzato in ambito aziendale, con l’obiettivo di automatizzare e migliorare una vasta gamma di processi.
Le caratteristiche di Mistral NeMo
Mistral NeMo ha una lunghezza di contesto di 128K, che gli consente di gestire input complessi e lunghi in modo più efficace rispetto a molti concorrenti. Il modello elabora informazioni estese in modo coerente, producendo output contestualmente rilevanti per le diverse esigenze aziendali.
Guillaume Lample, cofondatore e chief scientist di Mistral AI, ha sottolineato i vantaggi della collaborazione: “L’utilizzo dell’hardware e del software di NVIDIA ci ha permesso di sviluppare un modello di grande precisione, flessibilità ed efficienza, supportato da un’assistenza e una sicurezza di livello enterprise“.
L’addestramento del modello ha utilizzato l’infrastruttura NVIDIA AI, che comprende 3.072 GPU Tensor Core H100 80GB sulla piattaforma DGX Cloud AI. Questo processo ha incorporato tecniche di formazione accelerata per ottimizzare le prestazioni.
I vantaggi per le aziende di Mistral NeMo
Mistral NeMo offre diversi vantaggi chiave per gli utenti aziendali:
- Versatilità: Rilasciato con licenza Apache 2.0, è stato progettato per sostituire i sistemi che utilizzano Mistral 7B.
- Efficienza: Utilizza il formato dati FP8 per l’inferenza, riducendo il fabbisogno di memoria e accelerando l’implementazione senza perdere in accuratezza.
- Capacità multilingue: Eccelle in inglese, francese, tedesco, spagnolo, italiano, portoghese, cinese, giapponese, coreano, arabo e hindi.
- Miglioramento della tokenizzazione: Introduce Tekken, un nuovo tokenizzatore basato su Tiktoken, che mostra guadagni di efficienza in oltre 100 lingue.
- Facile implementazione: Confezionato come microservizio di inferenza NVIDIA NIM, consente una rapida configurazione in vari ambienti.
- Flessibilità hardware: Funziona su una singola GPU NVIDIA L40S, GeForce RTX 4090 o RTX 4500, bilanciando prestazioni e costi.
Disponibilità di Mistral NeMo 12B
Per le aziende che desiderano implementare capacità avanzate di AI, Mistral NeMo 12B offre una potente combinazione di funzionalità. La sua competenza multilingue e l’elaborazione efficiente lo rendono adatto a un’ampia gamma di applicazioni aziendali.
Inoltre, Mistral NeMo è progettato con sicurezza e supporto di livello aziendale, con rami di funzionalità dedicati, processi di convalida rigorosi e accordi completi sui livelli di servizio. Le aziende possono integrare perfettamente Mistral NeMo nelle loro applicazioni commerciali, beneficiando dell’accesso diretto agli esperti di AI di NVIDIA e di prestazioni affidabili e costanti.
Mistral NeMo è disponibile da subito su ai.nvidia.com, mentre una versione NIM scaricabile è in arrivo.