Mistral, la startup francese di intelligenza artificiale, ha recentemente rilasciato Pixtral 12B, un modello multimodale basato su uno dei suoi modelli di testo, NeMo 12B, sviluppato insieme a Nvidia. Con una dimensione di circa 24 GB e 12 miliardi di parametri, Pixtral 12B si posiziona come un potente strumento per l’elaborazione di immagini e testo.
Pixtral, il modello AI multimodale da 12B parametri di Mistral
La caratteristica principale di Pixtral 12B è la sua abilità nel processare e rispondere a domande su un numero arbitrario di immagini di qualsiasi dimensione, fornite tramite URL o codifica base64. Analogamente ad altri modelli multimodali come Claude di Anthropic e GPT-4o di OpenAI, ci si aspetta che Pixtral 12B sia in grado di eseguire compiti come la generazione di didascalie per le immagini e il conteggio di oggetti presenti nelle foto.
magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%https://t.co/OdtBUsbMKD%3A1337%2Fannounce&tr=udp%3A%2F%https://t.co/2UepcMHjvL%3A1337%2Fannounce&tr=http%3A%2F%https://t.co/NsTRgy7h8S%3A80%2Fannounce
— Mistral AI (@MistralAI) September 11, 2024
Disponibilità e licenza d’uso
Pixtral 12B è disponibile per il download tramite un link torrent su GitHub e sulla Hugging Face. Sebbene non siano ancora del tutto chiari i dettagli sulla licenza applicata a Pixtral 12B, si presume che segua la licenza dev standard di Mistral, che richiede un pagamento per l’uso commerciale, ma consente l’utilizzo gratuito per scopi di ricerca e accademici. Mistral offre anche alcuni modelli con licenza Apache 2.0 priva di restrizioni. Al momento del rilascio non erano disponibili demo web funzionanti di Pixtral 12B, ma l’azienda ha annunciato che sarà presto possibile testarlo sulle proprie piattaforme di chatbot e API.
Addestramento del modello e diritti di copyright
Come per la maggior parte dei sistemi AI, inclusi gli altri modelli di Mistral, non è stato reso noto su quali dati sia stato addestrato Pixtral 12B. Di solito, questi modelli vengono addestrati su grandi quantità di dati pubblici provenienti dal web, spesso protetti da copyright. Se alcuni provider sostengono che il “fair use” autorizzi la raccolta e l’impiego a scopo di ricerca di qualsiasi contenuto pubblicamente accessibile, chi ne detiene il copyright dissente e ritiene tale pratica una violazione dei loro diritti.
Diverse aziende del settore, tra cui Midjourney e OpenAI, che ha candidamente ammesso di utilizzare materiale protetto da copyright per addestrare i suoi modelli, sono state citate in giudizio con l’accusa di consentire la generazione di contenuti protetti senza autorizzazione. La mancanza di trasparenza sul training set di Pixtral 12B potrebbe dunque suscitare analoghi dubbi e preoccupazioni sulla tutela della proprietà intellettuale.
La crescita di Mistral
Il rilascio di Pixtral 12B arriva in un momento di grande slancio per Mistral, che ha da poco chiuso un round di finanziamento da 645 milioni di dollari, raggiungendo una valutazione di 6 miliardi. In poco più di un anno dal suo debutto, Mistral si è affermata come possibile risposta europea a OpenAI.