OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

OpenAI ha presentato ufficialmente tre nuovi modelli: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Questi modelli sono dotati di enormi capacità di elaborazione del contesto, fino a 1 milione di token, e limiti di conoscenza aggiornati fino a giugno 2024.

L'azienda afferma che questi modelli superano in prestazioni i modelli GPT-4o e GPT-4o mini recentemente aggiornati, lanciati lo scorso luglio. Al momento GPT-4.1 è disponibile solo tramite API, quindi non sarà ancora possibile utilizzarlo direttamente in ChatGPT.

OpenAI sottolinea che GPT-4.1 sarà disponibile solo tramite API. In ChatGPT, molti miglioramenti nella conformità delle istruzioni, nella programmazione e nell'intelligenza sono stati gradualmente integrati nell'ultima versione di GPT-4o e l'azienda continuerà ad aggiungerne altri nelle versioni future.

OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

I benchmark mostrano i notevoli miglioramenti apportati da GPT-4.1. Questo modello ha ottenuto un punteggio del 54,6% su SWE-bench Verified, con un incremento di 21,4 punti rispetto a GPT-4o. Il modello ha ottenuto un punteggio del 38,3% su MultiChallenge, un benchmark che misura l'aderenza alle linee guida, e ha stabilito un nuovo record per la comprensione di video di lunga durata con un punteggio del 72,0% sul benchmark Video-MME, in cui i modelli analizzano video lunghi fino a un'ora senza sottotitoli.

OpenAI ha inoltre collaborato con partner alpha per testare le prestazioni di GPT-4.1 in casi di utilizzo reali.

  • Thomson Reuters ha testato GPT-4.1 con il suo assistente legale basato sull'intelligenza artificiale CoCounsel. Rispetto a GPT-4o, GPT-4.1 registra un aumento del 17% nella precisione nella valutazione multi-documento. Questo tipo di lavoro si basa in larga misura sulla capacità di tracciare il contesto attraverso più fonti e di identificare relazioni complesse, come termini in conflitto o dipendenze nascoste, e GPT-4.1 ha costantemente dimostrato ottime prestazioni.
  • Carlyle ha utilizzato GPT-4.1 per estrarre dati finanziari da documenti lunghi e complessi, tra cui file Excel e PDF. Secondo i benchmark interni dell'azienda, il modello offre prestazioni migliori del 50% rispetto ai modelli precedenti nel recupero dei documenti. È il primo modello in grado di gestire in modo affidabile problemi quali la ricerca di un "ago in un pagliaio", la perdita di informazioni nel mezzo di un documento e argomenti che richiedono il collegamento di informazioni su più file.

Le prestazioni sono una cosa, ma la velocità è altrettanto importante. OpenAI afferma che GPT-4.1 restituisce il primo token in circa 15 secondi quando elabora 128.000 token e fino a 30 secondi quando elabora un milione di token. GPT-4.1 mini e nano sono ancora più veloci.

In genere, GPT-4.1 nano risponde in meno di 5 secondi alle richieste con 128.000 token di input. La memorizzazione nella cache rapida può ridurre ulteriormente la latenza, risparmiando al contempo sui costi.

Anche la comprensione delle immagini ha fatto notevoli progressi. In particolare, GPT-4.1 mini supera GPT-4o in vari benchmark visivi.

  • Su MMMU (inclusi grafici, diagrammi e mappe), GPT-4.1 mini ha ottenuto un punteggio del 73%. Questo valore è superiore a quello di GPT-4.5 e supera di gran lunga il 56% di GPT-4o mini.
  • Su MathVista (che testa la capacità di risolvere problemi di immagini), sia GPT-4.1 che GPT-4.1 mini hanno ottenuto un punteggio del 57%, superando di gran lunga il 37% di GPT-4o mini.
  • Su CharXiv-Reasoning , dove i modelli rispondono a domande basate su grafici scientifici, GPT-4.1 continua a essere leader.
  • Su Video-MME (video lunghi senza sottotitoli), GPT-4.1 ha raggiunto il 72%, un miglioramento significativo rispetto al 65% di GPT-4o.

Informazioni sul prezzo:

  • GPT-4.1 costa 2 $ per ogni milione di token in input e 8 $ per ogni milione di token in output.
  • Il prezzo di GPT-4.1 mini è di $ 0,40 per l'input e di $ 1,60 per l'output.
  • Il GPT-4.1 nano costa 0,10 $ in input e 0,40 $ in output.

L'utilizzo della memorizzazione nella cache dei prompt o dell'API Batch può ridurre ulteriormente questi costi, il che è ottimo per le applicazioni su larga scala. OpenAI si sta inoltre preparando a interrompere il supporto per GPT-4.5 Preview il 14 luglio 2025, citando le migliori prestazioni, la minore latenza e il costo inferiore di GPT-4.1.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

OpenAI ha rilasciato una versione più potente del suo modello di intelligenza artificiale basata sul ragionamento o1, o1-pro, nella sua API per sviluppatori.

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

Attualmente OpenAI offre quattro livelli di abbonamento a ChatGPT per soddisfare le esigenze di diversi gruppi di clienti.

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

Creando un progetto, gli utenti possono conservare conversazioni, file e istruzioni di personalizzazione, tutto in un unico posto. Ciò consente loro di riprendere facilmente a fare ciò che stavano facendo.

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI ha appena annunciato il programma Pioneers, un'iniziativa volta a promuovere l'applicazione dell'intelligenza artificiale in situazioni reali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

ChatGPT ti aiuterà a fare le cose meglio, dandoti l'opportunità di chattare direttamente con Babbo Natale.

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

Secondo The Verge, OpenAI prevede di lanciare Orion, il suo prossimo importante modello di intelligenza artificiale, a dicembre.

Alibaba lancia un modello di intelligenza artificiale in grado di leggere le emozioni umane

Alibaba lancia un modello di intelligenza artificiale in grado di leggere le emozioni umane

Il colosso cinese dell'e-commerce Alibaba continua a far notizia lanciando un nuovo modello di intelligenza artificiale che, a suo dire, è in grado di leggere le emozioni umane.

OpenAI lancia GPT Store e ChatGPT Team, portando lecosistema ChatGPT a un livello superiore

OpenAI lancia GPT Store e ChatGPT Team, portando lecosistema ChatGPT a un livello superiore

Dopo una lunga attesa e innumerevoli indiscrezioni, OpenAI ha finalmente annunciato il tanto atteso lancio di GPT Store e ChatGPT Team.

Amazon annuncia il modello audio Nova Sonic e afferma che le sue prestazioni superano quelle di OpenAI e Google

Amazon annuncia il modello audio Nova Sonic e afferma che le sue prestazioni superano quelle di OpenAI e Google

Amazon ha presentato oggi Nova Sonic, un modello avanzato di sintesi vocale che consente agli sviluppatori di creare app in grado di comunicare con voci simili a quelle umane in tempo reale.

Copilot è il modo migliore per utilizzare GPT-4 Turbo gratuitamente

Copilot è il modo migliore per utilizzare GPT-4 Turbo gratuitamente

Se vuoi provare GPT-4 Turbo, il modo migliore è utilizzare lo strumento Copilot di Microsoft.

OpenAI uccide silenziosamente leroe GPT-4

OpenAI uccide silenziosamente leroe GPT-4

OpenAI sta ufficialmente abbandonando GPT-4, uno dei modelli di intelligenza artificiale più famosi dell'azienda, divenuto virale due anni fa.

OpenAI è vicina a concludere un accordo con Samsung per utilizzare le sue funzionalità di intelligenza artificiale nei telefoni Galaxy

OpenAI è vicina a concludere un accordo con Samsung per utilizzare le sue funzionalità di intelligenza artificiale nei telefoni Galaxy

Secondo la rivista sudcoreana The Korea Herald, il gigante dell'intelligenza artificiale OpenAI vuole posizionarsi come potenziale rivale di Google.

OpenAI sviluppa una tecnologia di ricostruzione vocale a partire da una registrazione di soli 15 secondi

OpenAI sviluppa una tecnologia di ricostruzione vocale a partire da una registrazione di soli 15 secondi

OpenAI lancia una tecnologia in grado di ricreare la voce di chiunque con una registrazione di soli 15 secondi.

Modi in cui la musica stimola il cervello

Modi in cui la musica stimola il cervello

La maggior parte delle persone sa che la musica non ha solo uno scopo di intrattenimento, ma ha anche molti altri benefici. Ecco alcuni modi in cui la musica stimola lo sviluppo del nostro cervello.

I nutrienti più comunemente carenti nella dieta

I nutrienti più comunemente carenti nella dieta

La dieta è molto importante per la nostra salute. Tuttavia, la maggior parte delle nostre diete è spesso carente di questi sei nutrienti importanti.

Come utilizzare lapp CK Club di Circle K per ricevere offerte interessanti

Come utilizzare lapp CK Club di Circle K per ricevere offerte interessanti

Per ricevere più velocemente le informazioni promozionali da Circle K, dovresti installare l'app CK Club. L'applicazione salva i pagamenti effettuati durante lo shopping o presso Circle K, nonché il numero di francobolli raccolti.

Instagram consentirà reel lunghi fino a 3 minuti

Instagram consentirà reel lunghi fino a 3 minuti

Instagram ha appena annunciato che consentirà agli utenti di pubblicare video Reels lunghi fino a 3 minuti, il doppio del precedente limite di 90 secondi.

Come visualizzare le informazioni sulla CPU del Chromebook

Come visualizzare le informazioni sulla CPU del Chromebook

Questo articolo ti guiderà su come visualizzare le informazioni sulla CPU e controllarne la velocità direttamente sul tuo Chromebook.

8 cose fantastiche che puoi fare con un vecchio tablet Android

8 cose fantastiche che puoi fare con un vecchio tablet Android

Se non vuoi vendere o regalare il tuo vecchio tablet, puoi utilizzarlo in 5 modi: come cornice digitale di alta qualità, lettore musicale, lettore di e-book e riviste, assistente per le faccende domestiche e come schermo secondario.

Come ottenere unghie bellissime in modo rapido

Come ottenere unghie bellissime in modo rapido

Vuoi avere unghie belle, lucide e sane in tempi rapidi. Di seguito troverai dei semplici consigli utili per avere delle unghie bellissime.

I segreti dellispirazione per i colori che solo i designer conoscono

I segreti dellispirazione per i colori che solo i designer conoscono

In questo articolo elencheremo suggerimenti ispirati al colore, condivisi dai migliori designer della community Creative Market, per consentirti di ottenere ogni volta la combinazione di colori perfetta.

Tutto ciò che ti serve per sostituire il tuo laptop con un telefono

Tutto ciò che ti serve per sostituire il tuo laptop con un telefono

È davvero possibile sostituire il computer portatile con il telefono? Sì, ma per trasformare il tuo telefono in un laptop avrai bisogno degli accessori giusti.

ChatGPT sarà presto in grado di vedere tutto ciò che accade sul tuo schermo

ChatGPT sarà presto in grado di vedere tutto ciò che accade sul tuo schermo

Una cosa importante nel video completo dell'evento è che è stata fatta una demo della futura funzionalità dell'app ChatGPT, ma non sono stati condivisi dettagli concreti. È la capacità di ChatGPT di vedere tutto ciò che accade sullo schermo del dispositivo dell'utente.

Lintelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta

Lintelligenza artificiale sta imparando a ingannare gli umani nonostante sia stata addestrata ad essere onesta

Secondo un nuovo studio, molte delle migliori IA, nonostante siano state addestrate ad essere oneste, imparano a ingannare durante l'addestramento e inducono sistematicamente gli utenti a credere in false credenze.

Come modificare le domande su ChatGPT

Come modificare le domande su ChatGPT

ChatGPT ora offre un'opzione per modificare le domande, così gli utenti possono modificare la domanda o il contenuto che stanno scambiando con ChatGPT.

Come riconoscere i codici QR falsi e proteggere i tuoi dati

Come riconoscere i codici QR falsi e proteggere i tuoi dati

I codici QR sembrano piuttosto innocui, finché non ne scansioni uno dannoso e ti ritrovi con qualcosa di pericoloso nel sistema. Se vuoi proteggere il tuo telefono e i tuoi dati, ecco alcuni modi per identificare i codici QR falsi.

Qualcomm lancia il modem X85 5G con una serie di notevoli miglioramenti

Qualcomm lancia il modem X85 5G con una serie di notevoli miglioramenti

Sul palco del MWC 2025, Qualcomm ha fatto scalpore presentando l'ottava generazione del suo modem 5G, denominato X85, che dovrebbe essere utilizzato negli smartphone di punta in arrivo entro la fine dell'anno.

La nuova tecnologia consente ai telefoni di cambiare colore in modo flessibile

La nuova tecnologia consente ai telefoni di cambiare colore in modo flessibile

Hai un iPhone 16 "Ultramarine" alla moda, ma un bel giorno all'improvviso ti senti stufo di quel colore; Cosa farai?