Alibaba ha appena annunciato ufficialmente il suo ultimo modello di ragionamento e sembra che DeepSeek e OpenAI abbiano qualche motivo di preoccupazione, se tutto il "clamore" di Alibaba è vero. Questo modello è open source, quindi chiunque può accedervi e sperimentarlo gratuitamente.
Denominato QwQ-32b (Quan-with-Questions), il nuovo modello di intelligenza artificiale di Alibaba si basa su un numero notevolmente inferiore di parametri rispetto a quasi tutti i principali modelli linguistici attuali, il che significa che richiede meno risorse. Alibaba sostiene che QwQ-32b offre prestazioni pari a quelle di DeepSeek o di o1-mini di OpenAI.
Il modello linguistico di grandi dimensioni (LLM) DeepSeek-R1 ha fatto scalpore quando è stato lanciato all'inizio di febbraio, sfidando lo standard di riferimento stabilito da ChatGPT, ma a un costo operativo molto più basso. Con il QwQ-32b, sembra che Alibaba voglia spingere questo limite ancora oltre.
Tecnicamente DeepSeek-R1 richiede 671 miliardi di parametri per funzionare, di cui 37 miliardi abilitati. Nel frattempo, il QwQ-32b di Alibaba necessita solo di 32 miliardi di parametri. Questi numeri potrebbero sembrare astratti a molti, ma fanno un'enorme differenza nella potenza di calcolo: mentre DeepSeek-R1 richiedeva 1600 GB di VRAM per funzionare, QwQ-32b ne necessita solo di 24 GB. Nella maggior parte dei casi sarà necessaria una scheda grafica come la Nvidia H100 o equivalente, ma anche la RTX 4090, pensata per i gamer, ha 24 GB di VRAM. L'ultima RTX 5090 porta questo numero a 32 GB.
Si sostiene addirittura che, anche con soli 32 miliardi di parametri, QwQ-32B fornisca comunque prestazioni pari o superiori a R1 in ambiti quali matematica, programmazione e risoluzione di problemi in generale. Alibaba ha anche affermato che QwQ-32B supera le prestazioni di o1-mini di OpenAI, che è realizzato con 100 miliardi di parametri. QwQ-32B è disponibile su Hugging Face, la più grande comunità di modelli di intelligenza artificiale open source al mondo.

Il QwQ-32b di Alibaba è disponibile con licenza Apache 2.0, il che significa che aziende e ricercatori possono utilizzarlo liberamente. Ancora più importante, possiamo provarlo tramite Qwen Chat di Alibaba. Come DeepSeek, QwQ-32b presenta alcune limitazioni in termini di limiti di argomento. Ad esempio, se si chiede di parlare di questioni politiche, Qwen Chat visualizzerà un messaggio che indica che si tratta di un argomento inappropriato. Ma ci sono anche alcuni vantaggi che saltano subito all'occhio.
Il QwQ-32b sembra fornire risposte piuttosto dettagliate anche alle domande rapide e semplici. Questo può essere positivo, ma in un certo senso è piuttosto fastidioso perché fornisce molte informazioni inutili che non hai richiesto. Un vantaggio è che QwQ-32b può mostrare l'intero processo di ragionamento, in modo simile alla funzionalità Deep Thinking di ChatGPT, ma con meno profondità.
Resta da vedere se le affermazioni di Alibaba si avvereranno, ma sembra che ChatGPT e DeepSeek abbiano ora un nuovo degno concorrente.