Alibaba ha appena lanciato QVQ-Max. Il nuovo modello AI non si limita a comprendere il contenuto di foto e video, ma va oltre: analizza, ragiona e propone soluzioni.
Modello AI QVQ-Max di Alibaba che vede e pensa
QVQ-Max colma il divario tra i modelli AI basati sul testo e l’informazione del mondo reale. Grazie al ragionamento visivo, questo modello vede, capisce e riflette sulle cose che ci circondano. Alibaba sottolinea le eccezionali capacità di QVQ-Max nell’interpretare le immagini e identificarne gli elementi chiave, con una versatilità che spazia dalla progettazione di illustrazioni alla generazione di script video, fino al gioco di ruolo.
Al pari di altri chatbot AI, come ChatGPT o Gemini, QVQ-Max può assistere nel lavoro, nello studio e nella vita privata. Ma grazie alle sue abilità visive, fa molto di più: risolve problemi di matematica e fisica corredati di diagrammi, guida passo passo nella preparazione di un piatto partendo dalle immagini della ricetta.
Come provare QVQ-Max
Per iniziare a esplorare le potenzialità di QVQ-Max, basta andare su chat.qwen.ai, selezionare QVQ-Max dal menu a tendina in alto a sinistra (sotto “Expand more models”) e iniziare a chattare. È possibile anche allegare contenuti visivi per vedere cosa sa fare.
QVQ-Max è solo la prima versione del modello sviluppato da Alibaba, ma l’azienda ha già pianificato diversi miglioramenti per supportare un numero crescente di casi d’uso. L’obiettivo è migliorare la precisione nel riconoscimento delle immagini, la gestione di compiti complessi e multi-step, e permettere la generazione di immagini.