Alibaba, QwQ che ragiona come o1 di OpenAI, ma open source

Alibaba, QwQ che ragiona come o1 di OpenAI, ma open source

Alibaba ha rilasciato il modello AI QwQ-32B, con capacità di ragionamento, come alternativa open source a o1 di OpenAI. Che la sfida abbia inizio...
Alibaba, QwQ che ragiona come o1 di OpenAI, ma open source
Alibaba ha rilasciato il modello AI QwQ-32B, con capacità di ragionamento, come alternativa open source a o1 di OpenAI. Che la sfida abbia inizio...

C’è un nuovo modello AI “che ragiona” sulla piazza, e si chiama QwQ (QwQ-32B-Preview, per la precisione). Sviluppato da Alibaba, è uno dei pochi a potersi permettere il lusso di competere con o1 di OpenAI, ma a differenza di quest’ultimo, è disponibile per il download con una licenza permissiva.

Alibaba lancia QwQ per competere con o1 di OpenAI: 32,5 miliardi di parametri e prompt fino a 32.000 parole

QwQ-32B-Preview conta 32,5 miliardi di parametri e può elaborare prompt lunghi fino a 32.000 parole. Nei test di Alibaba, supera i modelli o1-preview e o1-mini di OpenAI in benchmark come AIME e MATH. Grazie alle sue capacità di “ragionamento”, riesce a risolvere rompicapi logici e problemi matematici piuttosto impegnativi, anche se non è perfetto. a volte cambia lingua inaspettatamente, si blocca in loop o fatica con il ragionamento di senso comune.

A differenza della maggior parte dei sistemi AI, QwQ-32B-Preview e altri modelli che “ragionano” si auto-correggono, evitando alcuni errori tipici ma impiegando più tempo per arrivare alla soluzione. Proprio come o1 di OpenAI, il modello di Alibaba pianifica e svolge una serie di azioni per dedurre le risposte.

Ma c’è un però… Essendo Alibaba un’azienda cinese, QwQ-32B-Preview deve allinearsi ai “valori socialisti fondamentali” imposti dal regolatore internet cinese. Alla domanda “Taiwan fa parte della Cina?“, ha risposto affermativamente, in linea con il partito al governo ma in contrasto con gran parte del mondo. Sui fatti di Piazza Tienanmen, invece, non ha risposto affatto. Non è un caso, visto che anche l’azienda cinese DeepSeek, che ha sfornato DeepSeek-R1, un altro modello con capacità di ragionamento, blocca le domande “scomode” sulla politica.

Disponibile su Hugging Face, ma con dei limiti

QwQ-32B-Preview può essere eseguito e scaricato dalla piattaforma di sviluppo AI Hugging Face, ma solo alcuni componenti del modello sono stati rilasciati. Questo rende impossibile replicarlo o capire a fondo il suo funzionamento interno. La sua “apertura” quindi suona più come uno specchietto per le allodole.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
28 nov 2024
Link copiato negli appunti