Meta lancia Llama 4: il LLM multimodale definitivo
Questa serie include tre versioni: Llama 4 Scout, Llama 4 Maverick e Llama 4 Behemoth.
All'inizio di aprile 2025, Meta ha lanciato Llama 4 , l'ultima serie di modelli di intelligenza artificiale progettati per portare l'azienda a un livello superiore. Ogni nuovo modello Llama 4 presenta notevoli miglioramenti rispetto ai suoi predecessori: ecco le nuove caratteristiche più importanti da provare.
3. Architettura del mix di esperti (MoE)
Una delle caratteristiche più notevoli dei modelli Llama 4 è la nuova architettura MoE, una novità per la serie Llama, che utilizza un approccio diverso rispetto ai modelli precedenti. Nella nuova architettura, solo una piccola frazione dei parametri del modello viene attivata per ogni token, a differenza dei tradizionali modelli di trasformatori densi come Llama 3 e precedenti, in cui tutti i parametri vengono attivati per ogni attività.
Ad esempio, Llama 4 Maverick utilizza solo 17 miliardi di parametri attivi su 400 miliardi, con 128 esperti instradati e un esperto condiviso. Llama 4 Scout, il più piccolo della serie, ha un totale di 109 miliardi di parametri, attivandone solo 17 miliardi con 16 esperti.
La versione più grande del trio, Llama 4 Behemoth, utilizza 288 miliardi di parametri attivi (con 16 esperti) su un totale di quasi due trilioni di parametri. Grazie a questa nuova architettura, a ogni compito vengono assegnati solo due specialisti.
Grazie al cambiamento architettonico, i modelli della serie Llama 4 risultano più efficienti dal punto di vista computazionale durante l'addestramento e l'inferenza. Abilitando solo una piccola parte dei parametri si riducono i costi del servizio e la latenza. Grazie all'architettura MoE, Meta sostiene che Llama può essere eseguito su una singola GPU Nvidia H100, un'impresa impressionante considerando il numero di parametri. Sebbene non ci siano metriche specifiche, si ritiene che ogni query su ChatGPT utilizzi più GPU Nvidia, il che crea un overhead maggiore in quasi tutte le metriche misurabili.
2. Capacità di elaborazione multimodale nativa
Un altro importante aggiornamento dei modelli di intelligenza artificiale di Llama 4 è l'elaborazione multimodale nativa, che consente al trio di comprendere simultaneamente testo e immagini.
Ciò è possibile grazie alla combinazione effettuata nella fase di formazione iniziale, in cui i token testuali e visivi vengono integrati in un'architettura unificata. I modelli vengono addestrati utilizzando grandi quantità di dati di testo, immagini e video non etichettati.
Non c'è niente di meglio. Se ricordate, l'aggiornamento Llama 3.2 di Meta , rilasciato nel settembre 2024, ha introdotto una serie di nuovi modelli (10 in totale), tra cui 5 modelli di visione multimodale e 5 modelli di testo. Con questa generazione, l'azienda non ha bisogno di rilasciare modelli di testo e di visione separati, grazie alle capacità di elaborazione multimodale native.
Inoltre, Llama 4 utilizza un codificatore visivo migliorato, che consente ai modelli di gestire complesse attività di inferenza visiva e input multi-immagine, rendendoli in grado di gestire applicazioni che richiedono una comprensione avanzata di testo e immagini. L'elaborazione multimodale consente inoltre di utilizzare i modelli LLama 4 in una vasta gamma di applicazioni.
1. Finestra contestuale leader del settore
I modelli di intelligenza artificiale di Llama 4 vantano una finestra contestuale senza precedenti, pari a un massimo di 10 milioni di token. Sebbene Llama 4 Behemoth sia ancora in fase di sviluppo al momento della pubblicazione, Llama 4 Scout ha stabilito un nuovo punto di riferimento nel settore grazie alla sua capacità di supportare fino a 10 milioni di token di lunghezza del contesto, consentendo di immettere testo più lungo di 5 milioni di parole.
Questa lunghezza estesa del contesto rappresenta un incremento significativo rispetto agli 8k token di Llama 3 al momento del suo lancio e persino rispetto alla successiva espansione a 128k dopo l'aggiornamento a Llama 3.2. E non è solo la lunghezza del contesto di 10 milioni di Llama 4 Scout a essere interessante; Anche Llama 4 Maverick, con la sua lunghezza di un milione di contesti, è un'impresa impressionante.
Llama 3.2 è attualmente uno dei migliori chatbot AI per conversazioni prolungate. Tuttavia, la finestra di contesto ampliata di Llama 4 pone Llama in testa, superando la precedente finestra di contesto da 2 milioni di token di Gemini, i 200.000 di Claude 3.7 Sonnet e i 128.000 di GPT-4.5.
Grazie all'ampia finestra di contesto, la serie Llama 4 è in grado di gestire attività che richiedono l'inserimento di grandi quantità di informazioni. Questa ampia finestra è utile per attività quali l'analisi di documenti lunghi e multipli, l'analisi dettagliata di grandi basi di codice e il ragionamento su grandi set di dati.
Permette inoltre a Llama 4 di effettuare conversazioni prolungate, a differenza dei precedenti modelli di Llama e dei modelli di altre aziende di intelligenza artificiale. Se uno dei motivi per cui Gemini 2.5 Pro è il miglior modello di ragionamento è la sua ampia finestra di contesto, puoi immaginare quanto sia potente una finestra di contesto 5x o 10x.
I modelli Llama della serie 3 di Meta sono tra i migliori LLM sul mercato. Ma con il rilascio della serie Llama 4, Meta fa un ulteriore passo avanti non solo concentrandosi sul miglioramento delle prestazioni di inferenza (grazie alla nuova finestra di contesto leader del settore), ma anche garantendo i modelli più efficienti possibili utilizzando una nuova architettura MoE sia durante l'addestramento che durante l'inferenza.
Le capacità di elaborazione multimodale nativa di Llama 4, l'efficiente architettura MoE e l'ampia finestra di contesto lo posizionano come un modello di intelligenza artificiale aperto, ad alte prestazioni e flessibile, ponderato in grado di competere o superare i modelli leader per inferenza, codifica e molte altre attività.
Le smart TV hanno davvero preso d'assalto il mondo. Grazie alle sue numerose funzionalità e alla connettività Internet, la tecnologia ha cambiato il nostro modo di guardare la TV.
I frigoriferi sono elettrodomestici comuni nelle case. I frigoriferi hanno solitamente 2 scomparti: lo scomparto freddo è spazioso e ha una luce che si accende automaticamente ogni volta che l'utente lo apre, mentre lo scomparto congelatore è stretto e non ha luce.
Oltre ai router, alla larghezza di banda e alle interferenze, le reti Wi-Fi sono influenzate da molti fattori, ma esistono alcuni modi intelligenti per potenziare la propria rete.
Se vuoi tornare alla versione stabile di iOS 16 sul tuo telefono, ecco la guida di base per disinstallare iOS 17 ed effettuare il downgrade da iOS 17 a 16.
Lo yogurt è un alimento meraviglioso. Fa bene mangiare yogurt tutti i giorni? Se mangiassi yogurt ogni giorno, come cambierebbe il tuo corpo? Scopriamolo insieme!
In questo articolo vengono illustrati i tipi di riso più nutrienti e come sfruttare al massimo i benefici per la salute offerti dal tipo di riso scelto.
Tra le misure che possono aiutarti a dormire meglio e a svegliarti puntuale al mattino c'è quella di stabilire un orario per dormire e una routine per andare a dormire, cambiare la sveglia e modificare la tua dieta.
Affitto per favore! Landlord Sim è un gioco di simulazione per dispositivi mobili, disponibile per iOS e Android. Giocherai nei panni del proprietario di un complesso di appartamenti e inizierai ad affittare un appartamento con l'obiettivo di migliorarne gli interni e prepararli per gli inquilini.
Ottieni il codice del gioco Roblox Bathroom Tower Defense e riscattalo per ottenere fantastiche ricompense. Ti aiuteranno a potenziare o sbloccare torri con danni maggiori.
Impariamo a conoscere la struttura, i simboli e i principi di funzionamento dei trasformatori nel modo più accurato.
Dalla migliore qualità dell'immagine e del suono al controllo vocale e molto altro, queste funzionalità basate sull'intelligenza artificiale stanno rendendo le smart TV molto migliori!
Inizialmente le aspettative per DeepSeek erano alte. In quanto chatbot basato sull'intelligenza artificiale, pubblicizzato come un forte concorrente di ChatGPT, promette funzionalità ed esperienze di chat intelligenti.
È facile trascurare dettagli importanti quando si prendono appunti di altre cose essenziali, e cercare di prendere appunti mentre si chiacchiera può distrarre. Fireflies.ai è la soluzione.
Gli Axolot di Minecraft saranno degli ottimi aiutanti per i giocatori che operano sott'acqua, se sapranno come usarli.
La configurazione di A Quiet Place: The Road Ahead ha ricevuto recensioni piuttosto positive, quindi è opportuno valutarla attentamente prima di decidere di scaricarla.