Gemma 2 o Llama 3 è il miglior modello open source?

In occasione dell'I/O 2024, Google ha annunciato la sua prossima linea di modelli Gemma 2 e ora l'azienda sta finalmente rilasciando i modelli leggeri con licenza open source. Si dice che il nuovo modello Gemma 2 27B sia molto promettente e che abbia prestazioni migliori rispetto ad alcuni modelli più grandi, come il Llama 3 70B e il Qwen 1.5 32B. Per verificare questa affermazione, confrontiamo Gemma 2 e Llama 3, due dei migliori modelli open source attuali.

Scrittura creativa

Per prima cosa, diamo un'occhiata a quanto Gemma 2 e Llama 3 siano validi dal punto di vista della scrittura creativa. L'autore dell'articolo ha chiesto a entrambe le modelle di scrivere un breve racconto sulla relazione tra la luna e il sole. Entrambi svolgono un ottimo lavoro, ma il modello Gemma 2 di Google si distingue per la sua prosa avvincente e la bella storia.

Gemma 2 o Llama 3 è il miglior modello open source?

D'altro canto, Llama 3 sembra un po' noioso e robotico. Google è sempre stata brava nella generazione di testo con i modelli Gemini e il più piccolo Gemma 2 27B non fa eccezione.

Opzione vincente: Gemma 2

Test multilingue

Nel prossimo round vedremo come entrambi i modelli gestiscono le lingue diverse dall'inglese. Poiché Google pubblicizza Gemma 2 come un'ottima soluzione per comprendere più lingue, l'autore lo ha confrontato con il modello Llama 3 di Meta. L'autore ha chiesto a entrambi i modelli di tradurre un brano in hindi. Sia Gemma 2 che Llama 3 hanno avuto ottime prestazioni.

L'autore ha provato anche un'altra lingua, il bengalese, e i modelli hanno prodotto risultati altrettanto buoni. Almeno per le lingue indiane, si può dire che Gemma 2 e Llama 3 sono ben addestrate su un corpus ampio. Tuttavia, la Gemma 2 27B è quasi 2,5 volte più piccola della Llama 3 70B, il che la rende ancora più impressionante.

Opzioni vincenti: Gemma 2 e Llama 3

Controllare la logica

Sebbene Gemma 2 e Llama 3 non siano i modelli più intelligenti sul mercato, riescono a svolgere alcuni comuni test di ragionamento proprio come modelli molto più grandi. Nel precedente confronto tra Llama 3 e GPT-4 , il modello 70B di Meta si è rivelato impressionante, dimostrando un'intelligenza piuttosto buona anche nelle dimensioni più ridotte.

In questo round, Llama 3 ha sconfitto Gemma 2 con una grande differenza di punteggio. Lama 3 ha risposto correttamente a 2 domande su 3, mentre Gemma 2 ha fatto fatica a rispondere correttamente anche a una sola. Gemma 2 semplicemente non è addestrata a risolvere problemi di ragionamento complessi.

D'altro canto, Llama 3 ha solide basi di ragionamento, che molto probabilmente possono essere dedotte dal set di dati crittografato. Nonostante le sue piccole dimensioni, almeno se paragonate ai modelli da mille miliardi di parametri come GPT-4, mostra un livello di intelligenza più che discreto. In definitiva, l'utilizzo di più token per addestrare il modello si traduce effettivamente in un modello più potente.

Opzione vincente: Lama 3

Seguire le istruzioni

Nel turno successivo, l'autore ha chiesto a Gemma 2 e Llama 3 di creare 10 parole che terminassero con la parola "NPU". E Lama 3 ha ottenuto 10/10 risposte corrette. Al contrario, Gemma 2 ha prodotto solo 7 frasi corrette su 10. In molte versioni precedenti, i modelli di Google, tra cui Gemini, non hanno seguito bene le istruzioni per l'utente. E la stessa tendenza continua con Gemma 2.

Per i modelli di intelligenza artificiale è fondamentale seguire le istruzioni dell'utente. Garantisce affidabilità e genera un feedback accurato per le istruzioni impartite. Anche dal punto di vista della sicurezza, aiuta a mantenere il modello ancorato ai supporti per una migliore conformità ai protocolli di sicurezza.

Opzione vincente: Lama 3

Trova informazioni

Sia Gemma 2 che Llama 3 hanno una lunghezza di contesto di 8K token. L'autore ha aggiunto un enorme blocco di testo, tratto direttamente dal libro Orgoglio e pregiudizio, contenente oltre 17.000 caratteri e 3,8K token. Come sempre, l'autore inserisce una citazione casuale da qualche parte nel testo e chiede a entrambi i modelli di trovarla.

Gemma 2 capì subito l'informazione e fece notare che la citazione era stata inserita in modo casuale. Anche Llama 3 ha scoperto e suggerito che questa affermazione sembrava fuori luogo. In termini di memoria di contesto lunga, sebbene limitata a token 8K, entrambi i modelli sono piuttosto validi sotto questo aspetto.

Si noti che l'autore ha eseguito questo test su HuggingChat (web) perché meta.ai ha rifiutato di eseguire questo prompt, molto probabilmente a causa del contenuto protetto da copyright.

Opzioni vincenti: Gemma 2 e Llama 3

Controllare le allucinazioni

I modelli più piccoli tendono a soffrire di allucinazioni dell'intelligenza artificiale a causa dei dati di addestramento limitati, spesso inventando informazioni quando il modello incontra argomenti non familiari. Così l'autore ha inventato il nome del suo paese per verificare se Gemma 2 e Llama 3 avessero le allucinazioni. E sorprendentemente non lo hanno fatto, il che significa che sia Google che Meta hanno una base piuttosto solida per i loro modelli.

L'autore pose anche un'altra domanda (falsa) per verificare la validità dei modelli, ma ancora una volta, non erano allucinogeni. A proposito, l'autore ha testato Llama 3 su HuggingChat mentre meta.ai navigava su Internet alla ricerca di informazioni aggiornate su argomenti rilevanti.

Opzioni vincenti: Gemma 2 e Llama 3

Concludere

Sebbene il modello Gemma 2 27B di Google non abbia buoni risultati nei test di ragionamento, è in grado di svolgere una serie di altri compiti. È ottimo per la scrittura creativa, supporta più lingue, ha una buona memoria e, soprattutto, non è allucinogeno come i modelli precedenti.

Llama 3 è migliore, ovviamente, ma è anche un modello significativamente più grande, addestrato su 70 miliardi di parametri. Gli sviluppatori troveranno il modello Gemma 2 27B utile per un'ampia gamma di casi d'uso. E per sicurezza, è disponibile anche la Gemma 2 9B.

Inoltre, gli utenti dovrebbero dare un'occhiata al Gemini 1.5 Flash, che è un modello molto più piccolo e supporta anch'esso l'input multimodale. Per non parlare del fatto che è incredibilmente veloce ed efficiente.

Tags: #gemma 2 #llama 3 #confronto tra gemma 2 e llama 3 #miglior modello open source #gemma 2 o llama 3 sono migliori

Come riottenere laccesso al disco rigido, correggere lerrore di impossibilità di aprire il disco rigido

In questo articolo ti guideremo su come recuperare l'accesso al tuo disco rigido in caso di guasto. Seguici!

Come utilizzare Conversation Awareness e Live Listen sugli AirPods

A prima vista, gli AirPods sembrano identici a qualsiasi altro auricolare true wireless. Ma tutto è cambiato quando sono state scoperte alcune caratteristiche poco note.

Tutto su iOS 26

Apple ha presentato iOS 26, un importante aggiornamento con un nuovissimo design in vetro smerigliato, esperienze più intelligenti e miglioramenti alle app più note.

I migliori laptop per studenti nel 2025

Gli studenti hanno bisogno di un tipo specifico di portatile per i loro studi. Non solo deve essere abbastanza potente da essere adatto al corso di laurea scelto, ma anche compatto e leggero da poter essere portato con sé tutto il giorno.

Come aggiungere una stampante a Windows 10

Aggiungere una stampante a Windows 10 è semplice, anche se la procedura per i dispositivi cablati sarà diversa da quella per i dispositivi wireless.

Come controllare la RAM e gli errori RAM sul tuo computer con la massima precisione

Come sapete, la RAM è una componente hardware molto importante in un computer: funge da memoria per l'elaborazione dei dati ed è il fattore che determina la velocità di un laptop o di un PC. Nell'articolo seguente, WebTech360 vi illustrerà alcuni metodi per verificare la presenza di errori nella RAM utilizzando un software su Windows.

Differenza tra TV normale e Smart TV

Le smart TV hanno davvero preso d'assalto il mondo. Grazie alle sue numerose funzionalità e alla connettività Internet, la tecnologia ha cambiato il nostro modo di guardare la TV.

Perché il congelatore non ha la luce mentre il frigorifero sì?

I frigoriferi sono elettrodomestici comuni nelle case. I frigoriferi hanno solitamente 2 scomparti: lo scomparto freddo è spazioso e ha una luce che si accende automaticamente ogni volta che l'utente lo apre, mentre lo scomparto congelatore è stretto e non ha luce.

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Oltre ai router, alla larghezza di banda e alle interferenze, le reti Wi-Fi sono influenzate da molti fattori, ma esistono alcuni modi intelligenti per potenziare la propria rete.

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Se vuoi tornare alla versione stabile di iOS 16 sul tuo telefono, ecco la guida di base per disinstallare iOS 17 ed effettuare il downgrade da iOS 17 a 16.

Cosa succede al corpo se mangi yogurt ogni giorno?

Lo yogurt è un alimento meraviglioso. Fa bene mangiare yogurt tutti i giorni? Se mangiassi yogurt ogni giorno, come cambierebbe il tuo corpo? Scopriamolo insieme!

Quale tipo di riso è migliore per la salute?

In questo articolo vengono illustrati i tipi di riso più nutrienti e come sfruttare al massimo i benefici per la salute offerti dal tipo di riso scelto.

Come svegliarsi puntuali la mattina

Tra le misure che possono aiutarti a dormire meglio e a svegliarti puntuale al mattino c'è quella di stabilire un orario per dormire e una routine per andare a dormire, cambiare la sveglia e modificare la tua dieta.

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Affitto per favore! Landlord Sim è un gioco di simulazione per dispositivi mobili, disponibile per iOS e Android. Giocherai nei panni del proprietario di un complesso di appartamenti e inizierai ad affittare un appartamento con l'obiettivo di migliorarne gli interni e prepararli per gli inquilini.

Ultimi codici di difesa della torre del bagno e come inserirli

Ottieni il codice del gioco Roblox Bathroom Tower Defense e riscattalo per ottenere fantastiche ricompense. Ti aiuteranno a potenziare o sbloccare torri con danni maggiori.

Gemma 2 o Llama 3 è il miglior modello open source?

Leave a Comment

Come riottenere laccesso al disco rigido, correggere lerrore di impossibilità di aprire il disco rigido

Come utilizzare Conversation Awareness e Live Listen sugli AirPods

Tutto su iOS 26

I migliori laptop per studenti nel 2025

Come aggiungere una stampante a Windows 10

Come controllare la RAM e gli errori RAM sul tuo computer con la massima precisione

Differenza tra TV normale e Smart TV

Perché il congelatore non ha la luce mentre il frigorifero sì?

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Cosa succede al corpo se mangi yogurt ogni giorno?

Quale tipo di riso è migliore per la salute?

Come svegliarsi puntuali la mattina

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Ultimi codici di difesa della torre del bagno e come inserirli