La scorsa settimana, i ricercatori di Microsoft hanno lanciato WizardLM 2, un modello linguistico open source, presentato come tra i più potenti fino ad oggi. Tuttavia, poche ore dopo il rilascio, il modello è stato rimosso da Internet poiché, come riportato da The Information, aveva “accidentalmente saltato” i necessari “test di tossicità” prima di essere reso pubblico.
La diffusione incontrollata del modello
Nonostante la rapida cancellazione di WizardLM 2, diverse persone sono riuscite a scaricare il modello nelle poche ore precedenti alla sua rimozione, ricaricandolo successivamente su piattaforme come Github e Hugging Face. Questo ha reso impossibile per Microsoft contenere la diffusione del modello, che l’azienda riteneva non fosse ancora pronto per il pubblico.
Secondo un post ora cancellato degli sviluppatori di WizardLM 2, il modello open source rappresenta la “nuova generazione di modelli linguistici di grandi dimensioni all’avanguardia di Microsoft“, con prestazioni migliorate in chat complesse, multilingue e ragionamento. Una particolarità di WizardLM 2 è l’addestramento su dati “sintetici”, ovvero dati creati da altri sistemi di intelligenza artificiale, anziché su dati prodotti dall’uomo.
I ricercatori Microsoft hanno utilizzato MT-Bench, un metodo per valutare automaticamente le prestazioni degli LLM. WizardLM 2 ha dimostrato “prestazioni altamente competitive rispetto ai modelli più avanzati come GPT-4-Turbo e Claude-3“. Sebbene il benchmarking nel settore dell’AI non sia una scienza perfetta, i ricercatori di Microsoft hanno comunque sottolineato la potenza del modello da loro creato.
La risposta di Microsoft
Microsoft non ha risposto a domande specifiche su come sia stato annunciato e poi rimosso il modello di AI WizardLM 2. La notizia sembra però provenire dall’account Twitter @WizardLM_AI, collegato alla pagina Github del ricercatore Microsoft Can Xu, coautore del primo WizardLM. La pagina di Xu rimanda anche ad un server Discord per WizardLM, dove l’altro ricercatore Microsoft Qingfeng Sun ha lo stesso avatar di @WizardLM_AI.
Il 16 aprile @WizardLM_AI ha twittato: “Ci scusiamo per questo. È passato del tempo dall’ultima volta che abbiamo rilasciato un modello, quindi avevamo poca familiarità con il nuovo processo di rilascio: abbiamo accidentalmente omesso un passaggio necessario, il test di tossicità. Stiamo completando rapidamente questo test e rilasceremo il nostro modello il prima possibile. Non preoccupatevi, grazie per la vostra gentile comprensione“.
WizardLM 2 circola ancora in versioni non censurate
Nonostante la disattivazione delle pagine Github e Hugging Face di WizardLM 2, è facile trovare molteplici istanze di reupload sulle stesse piattaforme. Inoltre, essendo il modello open source, esiste la possibilità che altre persone abbiano creato versioni non censurate in grado di produrre risposte controverse.