OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

OpenAI ha presentato ufficialmente tre nuovi modelli: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Questi modelli sono dotati di enormi capacità di elaborazione del contesto, fino a 1 milione di token, e limiti di conoscenza aggiornati fino a giugno 2024.

L'azienda afferma che questi modelli superano in prestazioni i modelli GPT-4o e GPT-4o mini recentemente aggiornati, lanciati lo scorso luglio. Al momento GPT-4.1 è disponibile solo tramite API, quindi non sarà ancora possibile utilizzarlo direttamente in ChatGPT.

OpenAI sottolinea che GPT-4.1 sarà disponibile solo tramite API. In ChatGPT, molti miglioramenti nella conformità delle istruzioni, nella programmazione e nell'intelligenza sono stati gradualmente integrati nell'ultima versione di GPT-4o e l'azienda continuerà ad aggiungerne altri nelle versioni future.

OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

I benchmark mostrano i notevoli miglioramenti apportati da GPT-4.1. Questo modello ha ottenuto un punteggio del 54,6% su SWE-bench Verified, con un incremento di 21,4 punti rispetto a GPT-4o. Il modello ha ottenuto un punteggio del 38,3% su MultiChallenge, un benchmark che misura l'aderenza alle linee guida, e ha stabilito un nuovo record per la comprensione di video di lunga durata con un punteggio del 72,0% sul benchmark Video-MME, in cui i modelli analizzano video lunghi fino a un'ora senza sottotitoli.

OpenAI ha inoltre collaborato con partner alpha per testare le prestazioni di GPT-4.1 in casi di utilizzo reali.

  • Thomson Reuters ha testato GPT-4.1 con il suo assistente legale basato sull'intelligenza artificiale CoCounsel. Rispetto a GPT-4o, GPT-4.1 registra un aumento del 17% nella precisione nella valutazione multi-documento. Questo tipo di lavoro si basa in larga misura sulla capacità di tracciare il contesto attraverso più fonti e di identificare relazioni complesse, come termini in conflitto o dipendenze nascoste, e GPT-4.1 ha costantemente dimostrato ottime prestazioni.
  • Carlyle ha utilizzato GPT-4.1 per estrarre dati finanziari da documenti lunghi e complessi, tra cui file Excel e PDF. Secondo i benchmark interni dell'azienda, il modello offre prestazioni migliori del 50% rispetto ai modelli precedenti nel recupero dei documenti. È il primo modello in grado di gestire in modo affidabile problemi quali la ricerca di un "ago in un pagliaio", la perdita di informazioni nel mezzo di un documento e argomenti che richiedono il collegamento di informazioni su più file.

Le prestazioni sono una cosa, ma la velocità è altrettanto importante. OpenAI afferma che GPT-4.1 restituisce il primo token in circa 15 secondi quando elabora 128.000 token e fino a 30 secondi quando elabora un milione di token. GPT-4.1 mini e nano sono ancora più veloci.

In genere, GPT-4.1 nano risponde in meno di 5 secondi alle richieste con 128.000 token di input. La memorizzazione nella cache rapida può ridurre ulteriormente la latenza, risparmiando al contempo sui costi.

Anche la comprensione delle immagini ha fatto notevoli progressi. In particolare, GPT-4.1 mini supera GPT-4o in vari benchmark visivi.

  • Su MMMU (inclusi grafici, diagrammi e mappe), GPT-4.1 mini ha ottenuto un punteggio del 73%. Questo valore è superiore a quello di GPT-4.5 e supera di gran lunga il 56% di GPT-4o mini.
  • Su MathVista (che testa la capacità di risolvere problemi di immagini), sia GPT-4.1 che GPT-4.1 mini hanno ottenuto un punteggio del 57%, superando di gran lunga il 37% di GPT-4o mini.
  • Su CharXiv-Reasoning , dove i modelli rispondono a domande basate su grafici scientifici, GPT-4.1 continua a essere leader.
  • Su Video-MME (video lunghi senza sottotitoli), GPT-4.1 ha raggiunto il 72%, un miglioramento significativo rispetto al 65% di GPT-4o.

Informazioni sul prezzo:

  • GPT-4.1 costa 2 $ per ogni milione di token in input e 8 $ per ogni milione di token in output.
  • Il prezzo di GPT-4.1 mini è di $ 0,40 per l'input e di $ 1,60 per l'output.
  • Il GPT-4.1 nano costa 0,10 $ in input e 0,40 $ in output.

L'utilizzo della memorizzazione nella cache dei prompt o dell'API Batch può ridurre ulteriormente questi costi, il che è ottimo per le applicazioni su larga scala. OpenAI si sta inoltre preparando a interrompere il supporto per GPT-4.5 Preview il 14 luglio 2025, citando le migliori prestazioni, la minore latenza e il costo inferiore di GPT-4.1.

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI annuncia Operator, un agente di intelligenza artificiale che esegue automaticamente attività per conto dellutente

OpenAI annuncia Operator, un agente di intelligenza artificiale che esegue automaticamente attività per conto dellutente

L'azienda dietro ChatGPT sta svelando un nuovo modo di utilizzare l'intelligenza artificiale. OpenAI ha appena annunciato Operator, un agente di intelligenza artificiale in grado di eseguire automaticamente delle attività per te.

OpenAI lancia un nuovo strumento per aiutare gli sviluppatori a creare agenti di intelligenza artificiale

OpenAI lancia un nuovo strumento per aiutare gli sviluppatori a creare agenti di intelligenza artificiale

Considerando gli agenti di intelligenza artificiale come il futuro del settore dell'intelligenza artificiale, OpenAI ammette che è molto difficile creare agenti potenti, di "livello industriale" con gli strumenti attuali.

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Resta da vedere se le affermazioni di Alibaba si avvereranno, ma sembra che ChatGPT e DeepSeek abbiano ora un nuovo degno concorrente.

OpenAI sfida Google Chrome con il suo nuovo browser

OpenAI sfida Google Chrome con il suo nuovo browser

Secondo quanto riferito, OpenAI sta lavorando a un progetto di browser web che potrebbe competere direttamente con Google Chrome.

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Secondo quanto riferito, Samsung Electronics starebbe collaborando con OpenAI a un ambizioso progetto congiunto per sviluppare TV AI che integrino tecnologie di intelligenza artificiale all'avanguardia nel settore.

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

Microsoft ha investito miliardi di dollari in OpenAI dal 2019, sebbene il colosso del software con sede a Redmond non sia affatto il principale investitore nell'innovativa startup di intelligenza artificiale.

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

OpenAI è in trattativa per acquisire Windsurf, l'editor di codice basato sull'intelligenza artificiale leader del settore.

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

OpenAI ha rilasciato una versione più potente del suo modello di intelligenza artificiale basata sul ragionamento o1, o1-pro, nella sua API per sviluppatori.

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

Attualmente OpenAI offre quattro livelli di abbonamento a ChatGPT per soddisfare le esigenze di diversi gruppi di clienti.

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

Creando un progetto, gli utenti possono conservare conversazioni, file e istruzioni di personalizzazione, tutto in un unico posto. Ciò consente loro di riprendere facilmente a fare ciò che stavano facendo.

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI ha appena annunciato il programma Pioneers, un'iniziativa volta a promuovere l'applicazione dell'intelligenza artificiale in situazioni reali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

ChatGPT ti aiuterà a fare le cose meglio, dandoti l'opportunità di chattare direttamente con Babbo Natale.

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

Secondo The Verge, OpenAI prevede di lanciare Orion, il suo prossimo importante modello di intelligenza artificiale, a dicembre.

Differenza tra TV normale e Smart TV

Differenza tra TV normale e Smart TV

Le smart TV hanno davvero preso d'assalto il mondo. Grazie alle sue numerose funzionalità e alla connettività Internet, la tecnologia ha cambiato il nostro modo di guardare la TV.

Perché il congelatore non ha la luce mentre il frigorifero sì?

Perché il congelatore non ha la luce mentre il frigorifero sì?

I frigoriferi sono elettrodomestici comuni nelle case. I frigoriferi hanno solitamente 2 scomparti: lo scomparto freddo è spazioso e ha una luce che si accende automaticamente ogni volta che l'utente lo apre, mentre lo scomparto congelatore è stretto e non ha luce.

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Oltre ai router, alla larghezza di banda e alle interferenze, le reti Wi-Fi sono influenzate da molti fattori, ma esistono alcuni modi intelligenti per potenziare la propria rete.

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Se vuoi tornare alla versione stabile di iOS 16 sul tuo telefono, ecco la guida di base per disinstallare iOS 17 ed effettuare il downgrade da iOS 17 a 16.

Cosa succede al corpo se mangi yogurt ogni giorno?

Cosa succede al corpo se mangi yogurt ogni giorno?

Lo yogurt è un alimento meraviglioso. Fa bene mangiare yogurt tutti i giorni? Se mangiassi yogurt ogni giorno, come cambierebbe il tuo corpo? Scopriamolo insieme!

Quale tipo di riso è migliore per la salute?

Quale tipo di riso è migliore per la salute?

In questo articolo vengono illustrati i tipi di riso più nutrienti e come sfruttare al massimo i benefici per la salute offerti dal tipo di riso scelto.

Come svegliarsi puntuali la mattina

Come svegliarsi puntuali la mattina

Tra le misure che possono aiutarti a dormire meglio e a svegliarti puntuale al mattino c'è quella di stabilire un orario per dormire e una routine per andare a dormire, cambiare la sveglia e modificare la tua dieta.

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Affitto per favore! Landlord Sim è un gioco di simulazione per dispositivi mobili, disponibile per iOS e Android. Giocherai nei panni del proprietario di un complesso di appartamenti e inizierai ad affittare un appartamento con l'obiettivo di migliorarne gli interni e prepararli per gli inquilini.

Ultimi codici di difesa della torre del bagno e come inserirli

Ultimi codici di difesa della torre del bagno e come inserirli

Ottieni il codice del gioco Roblox Bathroom Tower Defense e riscattalo per ottenere fantastiche ricompense. Ti aiuteranno a potenziare o sbloccare torri con danni maggiori.

Struttura, simboli e principi di funzionamento dei trasformatori

Struttura, simboli e principi di funzionamento dei trasformatori

Impariamo a conoscere la struttura, i simboli e i principi di funzionamento dei trasformatori nel modo più accurato.

4 modi in cui lintelligenza artificiale sta migliorando le smart TV

4 modi in cui lintelligenza artificiale sta migliorando le smart TV

Dalla migliore qualità dell'immagine e del suono al controllo vocale e molto altro, queste funzionalità basate sull'intelligenza artificiale stanno rendendo le smart TV molto migliori!

Perché ChatGPT è migliore di DeepSeek

Perché ChatGPT è migliore di DeepSeek

Inizialmente le aspettative per DeepSeek erano alte. In quanto chatbot basato sull'intelligenza artificiale, pubblicizzato come un forte concorrente di ChatGPT, promette funzionalità ed esperienze di chat intelligenti.

Scopri Fireflies.ai: la segretaria AI gratuita che ti fa risparmiare ore di lavoro

Scopri Fireflies.ai: la segretaria AI gratuita che ti fa risparmiare ore di lavoro

È facile trascurare dettagli importanti quando si prendono appunti di altre cose essenziali, e cercare di prendere appunti mentre si chiacchiera può distrarre. Fireflies.ai è la soluzione.

Come allevare lAxolotl in Minecraft, addomesticare la Salamandra in Minecraft

Come allevare lAxolotl in Minecraft, addomesticare la Salamandra in Minecraft

Gli Axolot di Minecraft saranno degli ottimi aiutanti per i giocatori che operano sott'acqua, se sapranno come usarli.

A Quiet Place: The Road Ahead Configurazione del gioco per PC

A Quiet Place: The Road Ahead Configurazione del gioco per PC

La configurazione di A Quiet Place: The Road Ahead ha ricevuto recensioni piuttosto positive, quindi è opportuno valutarla attentamente prima di decidere di scaricarla.