Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

La startup cinese di intelligenza artificiale DeepSeek ha appena rilasciato ufficialmente il suo ultimo modello linguistico di grandi dimensioni (LLM), DeepSeek-V3-0324. Con una capacità fino a 641 GB, questo modello è stato annunciato sulla piattaforma AI Hugging Face senza rivelare molte informazioni, in linea con lo stile di riservatezza sui nuovi prodotti che l'azienda ha sempre adottato finora.

La particolarità di questo modello è la licenza MIT, che ne consente il libero utilizzo per scopi commerciali. I primi risultati dei benchmark mostrano che DeepSeek-V3-0324 è in grado di funzionare su configurazioni hardware tradizionali, come Mac Studio di Apple con chip M3 Ultra. Lo scienziato dell'intelligenza artificiale Awni Hannun ha riferito che utilizzando questa configurazione è possibile raggiungere velocità di elaborazione superiori a 20 token al secondo. Questa capacità di eseguire un modello linguistico di grandi dimensioni su hardware di base in sede è in netto contrasto con l'approccio tradizionale che prevede l'utilizzo di enormi infrastrutture di data center per supportare modelli di intelligenza artificiale avanzati.

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

Secondo le informazioni fornite da DeepSeek, i test iniziali hanno evidenziato notevoli miglioramenti rispetto alle versioni precedenti. Questo modello è stato rigorosamente testato dagli stakeholder interni e ha dimostrato prestazioni eccellenti, superando persino tutti gli altri modelli concorrenti e superando Claude Sonnet 3.5 di Anthropic in attività che non richiedono una riflessione profonda. Tuttavia, a differenza dei modelli in stile Sonnet che richiedono un abbonamento a pagamento, DeepSeek-V3-0324 può essere scaricato e utilizzato in modo completamente gratuito.

Tecnicamente, DeepSeek-V3-0324 utilizza un'architettura mista di esperti (MoE). Si distingue per la sua capacità di utilizzare selettivamente circa 37 miliardi dei 685 miliardi di parametri per attività, aumentando l'efficienza mediante la riduzione delle richieste di calcolo e mantenendo inalterate le prestazioni. Questo modello applica anche le tecnologie Multi-Head Latent Attention (MLA) e Multi-Token Prediction (MTP), che contribuiscono a migliorare la memoria del contesto e ad accelerare l'output.

Gli utenti possono accedere a DeepSeek-V3-0324 tramite Hugging Face, l'interfaccia di chat e l'API di OpenRouter e, se lo desiderano, la piattaforma di chat di DeepSeek. Anche il fornitore di servizi di inferenza Hyperbolic Labs fornisce l'accesso al modello.

Con il rilascio di DeepSeek-V3-0324, l'azienda continua ad affermare la propria posizione nella corsa allo sviluppo di modelli linguistici di grandi dimensioni, offrendo al contempo un'opzione potente e accessibile per la comunità di ricerca e sviluppo dell'intelligenza artificiale. La possibilità di funzionare su hardware di consumo, abbinata a una licenza gratuita, aprirà sicuramente numerose opportunità di applicazione pratica per questo modello nel prossimo futuro.

Sign up and earn $1000 a day ⋙

Leave a Comment

Perché ChatGPT è migliore di DeepSeek

Perché ChatGPT è migliore di DeepSeek

Inizialmente le aspettative per DeepSeek erano alte. In quanto chatbot basato sull'intelligenza artificiale, pubblicizzato come un forte concorrente di ChatGPT, promette funzionalità ed esperienze di chat intelligenti.

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Resta da vedere se le affermazioni di Alibaba si avvereranno, ma sembra che ChatGPT e DeepSeek abbiano ora un nuovo degno concorrente.

Microsoft integra DeepSeek nella piattaforma PC Copilot+

Microsoft integra DeepSeek nella piattaforma PC Copilot+

A gennaio, Microsoft ha annunciato l'intenzione di portare le versioni ottimizzate per NPU del modello DeepSeek-R1 direttamente sui computer Copilot+ dotati di processori Qualcomm Snapdragon X.

Come registrare rapidamente un account DeepSeek

Come registrare rapidamente un account DeepSeek

L'app di intelligenza artificiale DeepSeek, con sede in Cina, è attualmente in testa alle classifiche degli app store.

I truffatori usano Deepseek per rubare i dati degli utenti

I truffatori usano Deepseek per rubare i dati degli utenti

I malintenzionati stanno creando migliaia di siti web simili a DeepSeek nella speranza che utenti ignari forniscano loro le proprie informazioni personali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Questi falsi annunci DeepSeek stanno diffondendo malware pericolosi

Questi falsi annunci DeepSeek stanno diffondendo malware pericolosi

Una serie di annunci truffa di DeepSeek su Google stanno diffondendo pericolosi malware in grado di rubare informazioni agli ignari utenti DeepSeek.

DeepSeek invita gli utenti a esplorare il dietro le quinte dellintelligenza artificiale open source dellazienda

DeepSeek invita gli utenti a esplorare il dietro le quinte dellintelligenza artificiale open source dellazienda

La startup cinese di intelligenza artificiale DeepSeek intende essere più "trasparente" riguardo alla tecnologia alla base dei suoi modelli di intelligenza artificiale open source, come il modello di ragionamento R1.

Huawei lancia il telefono pieghevole Pura X con assistente AI DeepSeek

Huawei lancia il telefono pieghevole Pura X con assistente AI DeepSeek

Huawei inaugura un'era completamente senza Android con il Pura X, un nuovo telefono pieghevole che utilizza il software HarmonyOS 5 dell'azienda e non include un'opzione che consenta agli utenti di utilizzare il sistema operativo di Google.

4 motivi per cui dovresti abbandonare ChatGPT e iniziare a usare DeepSeek

4 motivi per cui dovresti abbandonare ChatGPT e iniziare a usare DeepSeek

DeepSeek è il nome di un'azienda cinese di intelligenza artificiale e del suo chatbot omonimo. I modelli di punta dell'azienda, DeepSeek-V3 e DeepSeek-R1, hanno fatto scalpore perché sono più economici da addestrare e utilizzare rispetto alle loro controparti.

Dimentica la RTX 5070, nemmeno la RTX 5080 può battere la RTX 4090

Dimentica la RTX 5070, nemmeno la RTX 5080 può battere la RTX 4090

La settimana appena trascorsa non è stata felice né per gli investitori né per i fan di Nvidia.

Gli Stati Uniti stanno valutando lipotesi di indagare sul contrabbando di GPU Nvidia in Cina per far funzionare DeepSeek

Gli Stati Uniti stanno valutando lipotesi di indagare sul contrabbando di GPU Nvidia in Cina per far funzionare DeepSeek

DeepSeek, l'azienda cinese dietro al modello di intelligenza artificiale gratuita che sta rivoluzionando il mondo della tecnologia, sta affrontando una serie di accuse negative, tra cui l'utilizzo di GPU Nvidia di contrabbando per addestrare ed eseguire il suo omonimo modello di intelligenza artificiale.

Differenza tra TV normale e Smart TV

Differenza tra TV normale e Smart TV

Le smart TV hanno davvero preso d'assalto il mondo. Grazie alle sue numerose funzionalità e alla connettività Internet, la tecnologia ha cambiato il nostro modo di guardare la TV.

Perché il congelatore non ha la luce mentre il frigorifero sì?

Perché il congelatore non ha la luce mentre il frigorifero sì?

I frigoriferi sono elettrodomestici comuni nelle case. I frigoriferi hanno solitamente 2 scomparti: lo scomparto freddo è spazioso e ha una luce che si accende automaticamente ogni volta che l'utente lo apre, mentre lo scomparto congelatore è stretto e non ha luce.

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Oltre ai router, alla larghezza di banda e alle interferenze, le reti Wi-Fi sono influenzate da molti fattori, ma esistono alcuni modi intelligenti per potenziare la propria rete.

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Se vuoi tornare alla versione stabile di iOS 16 sul tuo telefono, ecco la guida di base per disinstallare iOS 17 ed effettuare il downgrade da iOS 17 a 16.

Cosa succede al corpo se mangi yogurt ogni giorno?

Cosa succede al corpo se mangi yogurt ogni giorno?

Lo yogurt è un alimento meraviglioso. Fa bene mangiare yogurt tutti i giorni? Se mangiassi yogurt ogni giorno, come cambierebbe il tuo corpo? Scopriamolo insieme!

Quale tipo di riso è migliore per la salute?

Quale tipo di riso è migliore per la salute?

In questo articolo vengono illustrati i tipi di riso più nutrienti e come sfruttare al massimo i benefici per la salute offerti dal tipo di riso scelto.

Come svegliarsi puntuali la mattina

Come svegliarsi puntuali la mattina

Tra le misure che possono aiutarti a dormire meglio e a svegliarti puntuale al mattino c'è quella di stabilire un orario per dormire e una routine per andare a dormire, cambiare la sveglia e modificare la tua dieta.

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Affitto per favore! Landlord Sim è un gioco di simulazione per dispositivi mobili, disponibile per iOS e Android. Giocherai nei panni del proprietario di un complesso di appartamenti e inizierai ad affittare un appartamento con l'obiettivo di migliorarne gli interni e prepararli per gli inquilini.

Ultimi codici di difesa della torre del bagno e come inserirli

Ultimi codici di difesa della torre del bagno e come inserirli

Ottieni il codice del gioco Roblox Bathroom Tower Defense e riscattalo per ottenere fantastiche ricompense. Ti aiuteranno a potenziare o sbloccare torri con danni maggiori.

Struttura, simboli e principi di funzionamento dei trasformatori

Struttura, simboli e principi di funzionamento dei trasformatori

Impariamo a conoscere la struttura, i simboli e i principi di funzionamento dei trasformatori nel modo più accurato.

4 modi in cui lintelligenza artificiale sta migliorando le smart TV

4 modi in cui lintelligenza artificiale sta migliorando le smart TV

Dalla migliore qualità dell'immagine e del suono al controllo vocale e molto altro, queste funzionalità basate sull'intelligenza artificiale stanno rendendo le smart TV molto migliori!

Perché ChatGPT è migliore di DeepSeek

Perché ChatGPT è migliore di DeepSeek

Inizialmente le aspettative per DeepSeek erano alte. In quanto chatbot basato sull'intelligenza artificiale, pubblicizzato come un forte concorrente di ChatGPT, promette funzionalità ed esperienze di chat intelligenti.

Scopri Fireflies.ai: la segretaria AI gratuita che ti fa risparmiare ore di lavoro

Scopri Fireflies.ai: la segretaria AI gratuita che ti fa risparmiare ore di lavoro

È facile trascurare dettagli importanti quando si prendono appunti di altre cose essenziali, e cercare di prendere appunti mentre si chiacchiera può distrarre. Fireflies.ai è la soluzione.

Come allevare lAxolotl in Minecraft, addomesticare la Salamandra in Minecraft

Come allevare lAxolotl in Minecraft, addomesticare la Salamandra in Minecraft

Gli Axolot di Minecraft saranno degli ottimi aiutanti per i giocatori che operano sott'acqua, se sapranno come usarli.

A Quiet Place: The Road Ahead Configurazione del gioco per PC

A Quiet Place: The Road Ahead Configurazione del gioco per PC

La configurazione di A Quiet Place: The Road Ahead ha ricevuto recensioni piuttosto positive, quindi è opportuno valutarla attentamente prima di decidere di scaricarla.