OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

OpenAI ha presentato ufficialmente tre nuovi modelli: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Questi modelli sono dotati di enormi capacità di elaborazione del contesto, fino a 1 milione di token, e limiti di conoscenza aggiornati fino a giugno 2024.

L'azienda afferma che questi modelli superano in prestazioni i modelli GPT-4o e GPT-4o mini recentemente aggiornati, lanciati lo scorso luglio. Al momento GPT-4.1 è disponibile solo tramite API, quindi non sarà ancora possibile utilizzarlo direttamente in ChatGPT.

OpenAI sottolinea che GPT-4.1 sarà disponibile solo tramite API. In ChatGPT, molti miglioramenti nella conformità delle istruzioni, nella programmazione e nell'intelligenza sono stati gradualmente integrati nell'ultima versione di GPT-4o e l'azienda continuerà ad aggiungerne altri nelle versioni future.

OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

I benchmark mostrano i notevoli miglioramenti apportati da GPT-4.1. Questo modello ha ottenuto un punteggio del 54,6% su SWE-bench Verified, con un incremento di 21,4 punti rispetto a GPT-4o. Il modello ha ottenuto un punteggio del 38,3% su MultiChallenge, un benchmark che misura l'aderenza alle linee guida, e ha stabilito un nuovo record per la comprensione di video di lunga durata con un punteggio del 72,0% sul benchmark Video-MME, in cui i modelli analizzano video lunghi fino a un'ora senza sottotitoli.

OpenAI ha inoltre collaborato con partner alpha per testare le prestazioni di GPT-4.1 in casi di utilizzo reali.

  • Thomson Reuters ha testato GPT-4.1 con il suo assistente legale basato sull'intelligenza artificiale CoCounsel. Rispetto a GPT-4o, GPT-4.1 registra un aumento del 17% nella precisione nella valutazione multi-documento. Questo tipo di lavoro si basa in larga misura sulla capacità di tracciare il contesto attraverso più fonti e di identificare relazioni complesse, come termini in conflitto o dipendenze nascoste, e GPT-4.1 ha costantemente dimostrato ottime prestazioni.
  • Carlyle ha utilizzato GPT-4.1 per estrarre dati finanziari da documenti lunghi e complessi, tra cui file Excel e PDF. Secondo i benchmark interni dell'azienda, il modello offre prestazioni migliori del 50% rispetto ai modelli precedenti nel recupero dei documenti. È il primo modello in grado di gestire in modo affidabile problemi quali la ricerca di un "ago in un pagliaio", la perdita di informazioni nel mezzo di un documento e argomenti che richiedono il collegamento di informazioni su più file.

Le prestazioni sono una cosa, ma la velocità è altrettanto importante. OpenAI afferma che GPT-4.1 restituisce il primo token in circa 15 secondi quando elabora 128.000 token e fino a 30 secondi quando elabora un milione di token. GPT-4.1 mini e nano sono ancora più veloci.

In genere, GPT-4.1 nano risponde in meno di 5 secondi alle richieste con 128.000 token di input. La memorizzazione nella cache rapida può ridurre ulteriormente la latenza, risparmiando al contempo sui costi.

Anche la comprensione delle immagini ha fatto notevoli progressi. In particolare, GPT-4.1 mini supera GPT-4o in vari benchmark visivi.

  • Su MMMU (inclusi grafici, diagrammi e mappe), GPT-4.1 mini ha ottenuto un punteggio del 73%. Questo valore è superiore a quello di GPT-4.5 e supera di gran lunga il 56% di GPT-4o mini.
  • Su MathVista (che testa la capacità di risolvere problemi di immagini), sia GPT-4.1 che GPT-4.1 mini hanno ottenuto un punteggio del 57%, superando di gran lunga il 37% di GPT-4o mini.
  • Su CharXiv-Reasoning , dove i modelli rispondono a domande basate su grafici scientifici, GPT-4.1 continua a essere leader.
  • Su Video-MME (video lunghi senza sottotitoli), GPT-4.1 ha raggiunto il 72%, un miglioramento significativo rispetto al 65% di GPT-4o.

Informazioni sul prezzo:

  • GPT-4.1 costa 2 $ per ogni milione di token in input e 8 $ per ogni milione di token in output.
  • Il prezzo di GPT-4.1 mini è di $ 0,40 per l'input e di $ 1,60 per l'output.
  • Il GPT-4.1 nano costa 0,10 $ in input e 0,40 $ in output.

L'utilizzo della memorizzazione nella cache dei prompt o dell'API Batch può ridurre ulteriormente questi costi, il che è ottimo per le applicazioni su larga scala. OpenAI si sta inoltre preparando a interrompere il supporto per GPT-4.5 Preview il 14 luglio 2025, citando le migliori prestazioni, la minore latenza e il costo inferiore di GPT-4.1.

Sign up and earn $1000 a day ⋙

Leave a Comment

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Resta da vedere se le affermazioni di Alibaba si avvereranno, ma sembra che ChatGPT e DeepSeek abbiano ora un nuovo degno concorrente.

OpenAI sfida Google Chrome con il suo nuovo browser

OpenAI sfida Google Chrome con il suo nuovo browser

Secondo quanto riferito, OpenAI sta lavorando a un progetto di browser web che potrebbe competere direttamente con Google Chrome.

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Secondo quanto riferito, Samsung Electronics starebbe collaborando con OpenAI a un ambizioso progetto congiunto per sviluppare TV AI che integrino tecnologie di intelligenza artificiale all'avanguardia nel settore.

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

Microsoft ha investito miliardi di dollari in OpenAI dal 2019, sebbene il colosso del software con sede a Redmond non sia affatto il principale investitore nell'innovativa startup di intelligenza artificiale.

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

OpenAI è in trattativa per acquisire Windsurf, l'editor di codice basato sull'intelligenza artificiale leader del settore.

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

OpenAI ha rilasciato una versione più potente del suo modello di intelligenza artificiale basata sul ragionamento o1, o1-pro, nella sua API per sviluppatori.

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

Attualmente OpenAI offre quattro livelli di abbonamento a ChatGPT per soddisfare le esigenze di diversi gruppi di clienti.

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

Creando un progetto, gli utenti possono conservare conversazioni, file e istruzioni di personalizzazione, tutto in un unico posto. Ciò consente loro di riprendere facilmente a fare ciò che stavano facendo.

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI ha appena annunciato il programma Pioneers, un'iniziativa volta a promuovere l'applicazione dell'intelligenza artificiale in situazioni reali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

ChatGPT ti aiuterà a fare le cose meglio, dandoti l'opportunità di chattare direttamente con Babbo Natale.

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

Secondo The Verge, OpenAI prevede di lanciare Orion, il suo prossimo importante modello di intelligenza artificiale, a dicembre.

Alibaba lancia un modello di intelligenza artificiale in grado di leggere le emozioni umane

Alibaba lancia un modello di intelligenza artificiale in grado di leggere le emozioni umane

Il colosso cinese dell'e-commerce Alibaba continua a far notizia lanciando un nuovo modello di intelligenza artificiale che, a suo dire, è in grado di leggere le emozioni umane.

OpenAI lancia GPT Store e ChatGPT Team, portando lecosistema ChatGPT a un livello superiore

OpenAI lancia GPT Store e ChatGPT Team, portando lecosistema ChatGPT a un livello superiore

Dopo una lunga attesa e innumerevoli indiscrezioni, OpenAI ha finalmente annunciato il tanto atteso lancio di GPT Store e ChatGPT Team.

Quali sono le dimensioni dei televisori da 32 pollici, 40 pollici, 43 pollici e 55 pollici... di Sony, Samsung, LG?

Quali sono le dimensioni dei televisori da 32 pollici, 40 pollici, 43 pollici e 55 pollici... di Sony, Samsung, LG?

L'articolo seguente ti aiuterà a comprendere le dimensioni delle attuali linee TV di Sony, Samsung e LG, così potrai prendere la giusta decisione d'acquisto.

7 semplici accorgimenti tecnologici che migliorano drasticamente la qualità della tua vita

7 semplici accorgimenti tecnologici che migliorano drasticamente la qualità della tua vita

Creare un rapporto sano con la tecnologia può sembrare scoraggiante, ma spesso piccoli cambiamenti fanno una grande differenza.

8 cose che non sapevi di poter fare nellapp Galleria di Samsung

8 cose che non sapevi di poter fare nellapp Galleria di Samsung

L'app Galleria di Samsung è più potente di quanto si possa pensare, ma questo non è immediatamente evidente.

Lo smartphone pieghevole di Microsoft non avrà pieghe

Lo smartphone pieghevole di Microsoft non avrà pieghe

Si dice che Microsoft sia sempre più vicina al lancio del suo primo smartphone pieghevole, dopo che il 1° ottobre le è stato concesso un brevetto per un telefono pieghevole in grado di piegarsi di 360 gradi senza creare pieghe sullo schermo.

Google testa il segno di spunta blu nella ricerca

Google testa il segno di spunta blu nella ricerca

Google sta testando una nuova funzionalità di verifica tramite un segno di spunta blu nella ricerca. Questa funzionalità aiuterà gli utenti a evitare di cliccare su link a siti web falsi o fraudolenti.

Distinguere Microsoft 365 e Office 2024

Distinguere Microsoft 365 e Office 2024

A prima vista, Microsoft 365 e Office 2024 possono sembrare molto simili, poiché entrambi consentono di accedere alle applicazioni Microsoft più diffuse e diffuse.

Ultimi codici di Elemental Dungeons e come inserirli

Ultimi codici di Elemental Dungeons e come inserirli

I codici Elemental Dungeons sono una forma di ricompensa necessaria per i giocatori. Come in qualsiasi altro gioco online su Roblox, i giocatori possono ricevere questi aiuti in cambio di denaro o altri oggetti.

Come ripetere la barra del titolo della tabella in Word

Come ripetere la barra del titolo della tabella in Word

Quando stampiamo un documento Word o creiamo una tabella in Word, ripetere il titolo in Word ci aiuta a rintracciarlo più facilmente e a leggere il titolo del documento senza problemi su diverse pagine, soprattutto con titoli lunghi.

Come creare messaggi animati su iMessage iOS 18

Come creare messaggi animati su iMessage iOS 18

Il nuovo iMessage di iOS 18 è stato aggiornato con messaggi animati, effetti di testo e numerose opzioni da utilizzare per i messaggi inviati.

Perché i maiali sono la nemesi dei serpenti?

Perché i maiali sono la nemesi dei serpenti?

C'è un fatto curioso sui maiali che non tutti sanno: i maiali sono considerati i nemici dei serpenti, perché quando questi due animali si incontrano, la maggior parte dei serpenti diventa cibo per i maiali.

Qual è la distanza tra la Terra e Giove, il pianeta più grande del sistema solare?

Qual è la distanza tra la Terra e Giove, il pianeta più grande del sistema solare?

Qual è la distanza tra la Terra e Giove? Se non lo sapete, questo articolo vi dirà quanto dista Giove dalla Terra.

Scopri i meta generali della stagione S1 2023 Lien Quan Mobile

Scopri i meta generali della stagione S1 2023 Lien Quan Mobile

Quali generali sono esclusi dalla meta della Mobile Alliance? Esploriamo ora

Stagione 7.5 di Graves DTCL: oggetti standard, squadra Graves Loi Long

Stagione 7.5 di Graves DTCL: oggetti standard, squadra Graves Loi Long

I DTCL di Graves delle stagioni 1, 3 e 6 costano tutti solo 1 oro e sembrano essere solo un campione aggiuntivo per stimolare il clan; il ruolo principale all'inizio del gioco è ancora utilizzato, ma non molto. A partire dalla stagione 7.5 di DTCL, il prezzo di Graves è schizzato a 4 monete d'oro ed è sicuramente un carry indispensabile se decidi di giocare Thunder Dragon o Gunner.

Come utilizzare i suoni delle app separate su Samsung

Come utilizzare i suoni delle app separate su Samsung

Con i telefoni Samsung dovresti usare la funzione audio dell'app separata. Ad esempio, puoi riprodurre Apple Music e il tuo telefono indirizzerà l'audio attraverso gli altoparlanti della tua auto.

Le belle citazioni sul lavoro, i buoni stati sul lavoro ti ispirano a raggiungere il successo

Le belle citazioni sul lavoro, i buoni stati sul lavoro ti ispirano a raggiungere il successo

Ci sono molti buoni stati sul lavoro su Internet. L'articolo riassumerà per voi le situazioni lavorative positive e significative.