Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

La startup cinese di intelligenza artificiale DeepSeek ha appena rilasciato ufficialmente il suo ultimo modello linguistico di grandi dimensioni (LLM), DeepSeek-V3-0324. Con una capacità fino a 641 GB, questo modello è stato annunciato sulla piattaforma AI Hugging Face senza rivelare molte informazioni, in linea con lo stile di riservatezza sui nuovi prodotti che l'azienda ha sempre adottato finora.

La particolarità di questo modello è la licenza MIT, che ne consente il libero utilizzo per scopi commerciali. I primi risultati dei benchmark mostrano che DeepSeek-V3-0324 è in grado di funzionare su configurazioni hardware tradizionali, come Mac Studio di Apple con chip M3 Ultra. Lo scienziato dell'intelligenza artificiale Awni Hannun ha riferito che utilizzando questa configurazione è possibile raggiungere velocità di elaborazione superiori a 20 token al secondo. Questa capacità di eseguire un modello linguistico di grandi dimensioni su hardware di base in sede è in netto contrasto con l'approccio tradizionale che prevede l'utilizzo di enormi infrastrutture di data center per supportare modelli di intelligenza artificiale avanzati.

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

Secondo le informazioni fornite da DeepSeek, i test iniziali hanno evidenziato notevoli miglioramenti rispetto alle versioni precedenti. Questo modello è stato rigorosamente testato dagli stakeholder interni e ha dimostrato prestazioni eccellenti, superando persino tutti gli altri modelli concorrenti e superando Claude Sonnet 3.5 di Anthropic in attività che non richiedono una riflessione profonda. Tuttavia, a differenza dei modelli in stile Sonnet che richiedono un abbonamento a pagamento, DeepSeek-V3-0324 può essere scaricato e utilizzato in modo completamente gratuito.

Tecnicamente, DeepSeek-V3-0324 utilizza un'architettura mista di esperti (MoE). Si distingue per la sua capacità di utilizzare selettivamente circa 37 miliardi dei 685 miliardi di parametri per attività, aumentando l'efficienza mediante la riduzione delle richieste di calcolo e mantenendo inalterate le prestazioni. Questo modello applica anche le tecnologie Multi-Head Latent Attention (MLA) e Multi-Token Prediction (MTP), che contribuiscono a migliorare la memoria del contesto e ad accelerare l'output.

Gli utenti possono accedere a DeepSeek-V3-0324 tramite Hugging Face, l'interfaccia di chat e l'API di OpenRouter e, se lo desiderano, la piattaforma di chat di DeepSeek. Anche il fornitore di servizi di inferenza Hyperbolic Labs fornisce l'accesso al modello.

Con il rilascio di DeepSeek-V3-0324, l'azienda continua ad affermare la propria posizione nella corsa allo sviluppo di modelli linguistici di grandi dimensioni, offrendo al contempo un'opzione potente e accessibile per la comunità di ricerca e sviluppo dell'intelligenza artificiale. La possibilità di funzionare su hardware di consumo, abbinata a una licenza gratuita, aprirà sicuramente numerose opportunità di applicazione pratica per questo modello nel prossimo futuro.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft integra DeepSeek nella piattaforma PC Copilot+

Microsoft integra DeepSeek nella piattaforma PC Copilot+

A gennaio, Microsoft ha annunciato l'intenzione di portare le versioni ottimizzate per NPU del modello DeepSeek-R1 direttamente sui computer Copilot+ dotati di processori Qualcomm Snapdragon X.

Come registrare rapidamente un account DeepSeek

Come registrare rapidamente un account DeepSeek

L'app di intelligenza artificiale DeepSeek, con sede in Cina, è attualmente in testa alle classifiche degli app store.

I truffatori usano Deepseek per rubare i dati degli utenti

I truffatori usano Deepseek per rubare i dati degli utenti

I malintenzionati stanno creando migliaia di siti web simili a DeepSeek nella speranza che utenti ignari forniscano loro le proprie informazioni personali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Questi falsi annunci DeepSeek stanno diffondendo malware pericolosi

Questi falsi annunci DeepSeek stanno diffondendo malware pericolosi

Una serie di annunci truffa di DeepSeek su Google stanno diffondendo pericolosi malware in grado di rubare informazioni agli ignari utenti DeepSeek.

DeepSeek invita gli utenti a esplorare il dietro le quinte dellintelligenza artificiale open source dellazienda

DeepSeek invita gli utenti a esplorare il dietro le quinte dellintelligenza artificiale open source dellazienda

La startup cinese di intelligenza artificiale DeepSeek intende essere più "trasparente" riguardo alla tecnologia alla base dei suoi modelli di intelligenza artificiale open source, come il modello di ragionamento R1.

Huawei lancia il telefono pieghevole Pura X con assistente AI DeepSeek

Huawei lancia il telefono pieghevole Pura X con assistente AI DeepSeek

Huawei inaugura un'era completamente senza Android con il Pura X, un nuovo telefono pieghevole che utilizza il software HarmonyOS 5 dell'azienda e non include un'opzione che consenta agli utenti di utilizzare il sistema operativo di Google.

4 motivi per cui dovresti abbandonare ChatGPT e iniziare a usare DeepSeek

4 motivi per cui dovresti abbandonare ChatGPT e iniziare a usare DeepSeek

DeepSeek è il nome di un'azienda cinese di intelligenza artificiale e del suo chatbot omonimo. I modelli di punta dell'azienda, DeepSeek-V3 e DeepSeek-R1, hanno fatto scalpore perché sono più economici da addestrare e utilizzare rispetto alle loro controparti.

Dimentica la RTX 5070, nemmeno la RTX 5080 può battere la RTX 4090

Dimentica la RTX 5070, nemmeno la RTX 5080 può battere la RTX 4090

La settimana appena trascorsa non è stata felice né per gli investitori né per i fan di Nvidia.

Gli Stati Uniti stanno valutando lipotesi di indagare sul contrabbando di GPU Nvidia in Cina per far funzionare DeepSeek

Gli Stati Uniti stanno valutando lipotesi di indagare sul contrabbando di GPU Nvidia in Cina per far funzionare DeepSeek

DeepSeek, l'azienda cinese dietro al modello di intelligenza artificiale gratuita che sta rivoluzionando il mondo della tecnologia, sta affrontando una serie di accuse negative, tra cui l'utilizzo di GPU Nvidia di contrabbando per addestrare ed eseguire il suo omonimo modello di intelligenza artificiale.

I monitor esterni possono avere un impatto negativo sulle batterie dei computer portatili.

I monitor esterni possono avere un impatto negativo sulle batterie dei computer portatili.

Utilizzare un computer portatile con un monitor esterno è un'ottima combinazione per aumentare la produttività e aiutarti a portare a termine il lavoro. Ma col tempo, scoprirai che la batteria del tuo portatile si scarica rapidamente e la sua durata inizia a ridursi.

8 principali svantaggi degli smartphone con schermo pieghevole che non ti aspettavi

8 principali svantaggi degli smartphone con schermo pieghevole che non ti aspettavi

Non si può negare che i telefoni pieghevoli siano davvero fantastici. Ma dopo un po' di utilizzo, questo dispositivo inizia a presentare alcune stranezze. Ecco 5 svantaggi principali dei telefoni con schermo pieghevole che non ti aspetteresti!

Adobe porta la tecnologia di creazione video basata sullintelligenza artificiale su Premiere Pro

Adobe porta la tecnologia di creazione video basata sullintelligenza artificiale su Premiere Pro

Adobe ha reso accessibile al grande pubblico la tecnologia di creazione video basata sull'intelligenza artificiale in un modo del tutto nuovo, anche se non ha ancora creato un film completo utilizzando questa tecnologia.

Ultimi codici di Genshin Impact di aprile 2025

Ultimi codici di Genshin Impact di aprile 2025

Il codice Genshin Impact 5.5 ti aiuta a ottenere Pietre Primordiali, Minerali Magici, esperienza e molte altre ricompense.

Come trasformare il tuo iPad in un display Mac aggiuntivo

Come trasformare il tuo iPad in un display Mac aggiuntivo

macOS Catalina e iPadOS includono il supporto per una nuova funzionalità chiamata Sidecar, progettata per consentirti di usare il tuo iPad come display secondario per il tuo Mac.

Sfondo 1280, bellissimo sfondo del telefono Nokia 1280

Sfondo 1280, bellissimo sfondo del telefono Nokia 1280

Questo è un set di sfondi per Nokia 1280. Se hai mai inviato un messaggio per ottenere sfondi per 1280, sfondi per telefoni con mattoncini, prova a dare un'occhiata a questi sfondi.

Laereo spaziale ipersonico raggiunge la velocità di 11.115 km/h

Laereo spaziale ipersonico raggiunge la velocità di 11.115 km/h

Venus Aerospace ha rivelato le prime immagini del suo nuovo aereo ipersonico chiamato Stargazer, che può raggiungere una velocità massima di 11.115 km/h, pari a Mach 9.

Mangiare banane a colazione aiuta a ridurre il gonfiore

Mangiare banane a colazione aiuta a ridurre il gonfiore

Il gonfiore può capitare a chiunque. La buona notizia è che la colazione è il momento ideale per aggiungere al pasto alcuni ingredienti che aiutano a ridurre il gonfiore. L'ingrediente in questione è la banana.

OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

OpenAI ha appena introdotto ufficialmente un notevole aggiornamento alla capacità di generazione di immagini AI in ChatGPT, un importante passo avanti rispetto all'utilizzo di un modello di generazione di immagini separato come il precedente DALL-E.

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

La startup cinese di intelligenza artificiale DeepSeek ha appena rilasciato ufficialmente il suo ultimo modello linguistico di grandi dimensioni (LLM), DeepSeek-V3-0324.

Motivi per abbandonare Gboard e passare alla tastiera Samsung

Motivi per abbandonare Gboard e passare alla tastiera Samsung

Gboard è da tempo la tastiera preferita sui telefoni Android. Tuttavia, di recente molte persone sono passate alla tastiera Samsung e non se ne sono più pentite.

Dolci e romantici auguri di fine settimana per gli innamorati

Dolci e romantici auguri di fine settimana per gli innamorati

Invia dolci e romantici auguri di buon fine settimana alla tua dolce metà. Sebbene siano solo parole o messaggi, saranno doni spirituali significativi, che contribuiranno a rafforzare la vostra relazione.

La serie TV di Harry Potter ha bisogno dei seguenti elementi per avere successo

La serie TV di Harry Potter ha bisogno dei seguenti elementi per avere successo

Il remake di Harry Potter della HBO dovrebbe debuttare nel 2026. Ecco cosa rende la serie TV di Harry Potter un successo.

Immagini mozzafiato della superluna da tutto il mondo

Immagini mozzafiato della superluna da tutto il mondo

Non è raro trovare su Internet delle belle foto della luna. L'articolo riassumerà per voi le più belle immagini della luna del mondo.

Gli utenti AMD Ryzen dovrebbero installare questo aggiornamento del BIOS per un aumento gratuito delle prestazioni

Gli utenti AMD Ryzen dovrebbero installare questo aggiornamento del BIOS per un aumento gratuito delle prestazioni

Ora AMD ha risposto ai problemi della sua linea di CPU di punta dalle prestazioni inferiori alle aspettative con un nuovo aggiornamento che potrebbe garantire qualche frame al secondo in più.