Nvidia ha appena rilasciato NVLM 1.0, una famiglia di potenti modelli linguistici multimodali open-source pronta a competere GPT-4 di OpenAI e Gemini di Google, adesso disponibile gratuitamente per tutti gli utenti Android. Il fiore all’occhiello di questa serie è NVLM-D-72B, un modello da 72 miliardi di parametri che si distingue per le sue notevoli prestazioni in compiti che combinano visione e linguaggio. Inoltre, eccelle anche nell’analisi del solo testo.
Il nuovo modello AI di NVIDIA da 72 miliardi di parametri sfida i leader del settore
Il modello AI NVLM-D-72B si dimostra estremamente versatile nell’elaborare input complessi, siano essi immagini o testo. I ricercatori hanno mostrato esempi in cui il modello è in grado di interpretare meme, analizzare immagini e risolvere problemi matematici passo dopo passo.
Ma la vera sorpresa sta nel fatto che, dopo l’addestramento multimodale, NVLM-D-72B migliora le sue prestazioni anche nei compiti di solo testo, con un aumento medio di 4,3 punti nei principali benchmark, laddove molti modelli simili registrano invece un calo.
Un accoglienza calorosa per il nuovo modello AI di NVIDIA
La decisione di Nvidia di rendere pubblici i pesi del modello e di rilasciare il codice di addestramento ha suscitato reazioni entusiastiche nella comunità dell’AI. Ricercatori e sviluppatori hanno ora accesso a una tecnologia all’avanguardia che prima era appannaggio solo di poche aziende tecnologiche ben finanziate.
Questo potrebbe accelerare notevolmente la ricerca e lo sviluppo dell’intelligenza artificiale in tutto il settore, consentendo anche ad aziende più piccole e ricercatori indipendenti di dare un contributo significativo ai progressi in questo campo.
Questa mossa di Nvidia potrebbe spingere altri player del settore ad aprire i loro modelli, accelerando il progresso generale dell’AI. Tuttavia, l’accessibilità porta con sé anche preoccupazioni riguardo al suo uso improprio e alle implicazioni etiche, ponendo la comunità di fronte alla sfida di promuovere l’innovazione stabilendo al contempo paletti per un utilizzo responsabile.