Il gruppo tecnologico cinese Alibaba ha appena annunciato un nuovo modello di intelligenza artificiale chiamato QVQ-Max della serie Qwen, che segna una svolta nel campo dell'intelligenza artificiale multimediale. La caratteristica speciale di questo modello è la capacità di analizzare i contenuti di immagini/video e quindi elaborare argomentazioni e soluzioni sulla base delle informazioni ottenute.
Capacità impressionante
QVQ-Max è descritto da Alibaba come un ponte tra i modelli di intelligenza artificiale basati esclusivamente su testo e il mondo reale. Grazie alle capacità di ragionamento visivo, il sistema può:
- Analizza le immagini e identifica gli elementi chiave
- Applicazione versatile in molti campi, dalla progettazione di illustrazioni, alla creazione di sceneggiature video, al gioco di ruolo dei personaggi
- Risolvere problemi con diagrammi (matematica, fisica)
- Istruzioni di cottura passo passo basate sulle immagini della ricetta
Alibaba afferma che il modello aiuta a colmare il divario tra le IA che elaborano solo testo e le informazioni del mondo reale. Grazie alla sua capacità di ragionamento visivo, QVQ-Max può "vedere, comprendere e pensare" al mondo che lo circonda. L'azienda sottolinea il suo modello superiore nell'analisi delle immagini, nell'identificazione degli elementi chiave e nella sua flessibilità di applicazione in molti campi, come la progettazione di illustrazioni, la creazione di sceneggiature video o i giochi di ruolo.

Come altri chatbot AI, QVQ-Max supporta il lavoro, l'istruzione e la vita personale, ma grazie all'integrazione visiva, risolve anche compiti più specifici come: risolvere problemi di matematica/fisica con diagrammi, istruzioni di cucina tramite immagini di ricette.
Alibaba considera QVQ-Max la prima versione e ha delineato una roadmap di aggiornamento per le versioni successive. Innanzitutto, volevano migliorare la precisione del riconoscimento delle immagini utilizzando tecniche di messa a terra. In secondo luogo, il modello sarà ottimizzato per gestire il multitasking e problemi complessi, come lavorare con telefoni, computer o giocare. Alibaba prevede in futuro di passare dall'interazione tramite testo alla verifica degli strumenti e alla creazione di contenuti basati su immagini.
Gli utenti possono provare QVQ-Max nei seguenti modi:
- Visita chat.qwen.ai
- Seleziona il menu dei modelli nell'angolo sinistro → " Espandi altri modelli "
- Seleziona QVQ-Max e inizia a chattare
- Allega file di immagini per esplorare le capacità di elaborazione dell'intelligenza artificiale
Con il lancio di QVQ-Max, Alibaba continua ad affermare la propria posizione nella corsa allo sviluppo dell'intelligenza artificiale multimediale, competendo direttamente con i giganti della tecnologia mondiale. Il modello promette applicazioni pratiche nel lavoro, nell'istruzione e nella vita personale.