OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

OpenAI ha presentato ufficialmente tre nuovi modelli: GPT-4.1, GPT-4.1 mini e GPT-4.1 nano. Questi modelli sono dotati di enormi capacità di elaborazione del contesto, fino a 1 milione di token, e limiti di conoscenza aggiornati fino a giugno 2024.

L'azienda afferma che questi modelli superano in prestazioni i modelli GPT-4o e GPT-4o mini recentemente aggiornati, lanciati lo scorso luglio. Al momento GPT-4.1 è disponibile solo tramite API, quindi non sarà ancora possibile utilizzarlo direttamente in ChatGPT.

OpenAI sottolinea che GPT-4.1 sarà disponibile solo tramite API. In ChatGPT, molti miglioramenti nella conformità delle istruzioni, nella programmazione e nell'intelligenza sono stati gradualmente integrati nell'ultima versione di GPT-4o e l'azienda continuerà ad aggiungerne altri nelle versioni future.

OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

I benchmark mostrano i notevoli miglioramenti apportati da GPT-4.1. Questo modello ha ottenuto un punteggio del 54,6% su SWE-bench Verified, con un incremento di 21,4 punti rispetto a GPT-4o. Il modello ha ottenuto un punteggio del 38,3% su MultiChallenge, un benchmark che misura l'aderenza alle linee guida, e ha stabilito un nuovo record per la comprensione di video di lunga durata con un punteggio del 72,0% sul benchmark Video-MME, in cui i modelli analizzano video lunghi fino a un'ora senza sottotitoli.

OpenAI ha inoltre collaborato con partner alpha per testare le prestazioni di GPT-4.1 in casi di utilizzo reali.

Thomson Reuters ha testato GPT-4.1 con il suo assistente legale basato sull'intelligenza artificiale CoCounsel. Rispetto a GPT-4o, GPT-4.1 registra un aumento del 17% nella precisione nella valutazione multi-documento. Questo tipo di lavoro si basa in larga misura sulla capacità di tracciare il contesto attraverso più fonti e di identificare relazioni complesse, come termini in conflitto o dipendenze nascoste, e GPT-4.1 ha costantemente dimostrato ottime prestazioni.
Carlyle ha utilizzato GPT-4.1 per estrarre dati finanziari da documenti lunghi e complessi, tra cui file Excel e PDF. Secondo i benchmark interni dell'azienda, il modello offre prestazioni migliori del 50% rispetto ai modelli precedenti nel recupero dei documenti. È il primo modello in grado di gestire in modo affidabile problemi quali la ricerca di un "ago in un pagliaio", la perdita di informazioni nel mezzo di un documento e argomenti che richiedono il collegamento di informazioni su più file.

Le prestazioni sono una cosa, ma la velocità è altrettanto importante. OpenAI afferma che GPT-4.1 restituisce il primo token in circa 15 secondi quando elabora 128.000 token e fino a 30 secondi quando elabora un milione di token. GPT-4.1 mini e nano sono ancora più veloci.

In genere, GPT-4.1 nano risponde in meno di 5 secondi alle richieste con 128.000 token di input. La memorizzazione nella cache rapida può ridurre ulteriormente la latenza, risparmiando al contempo sui costi.

Anche la comprensione delle immagini ha fatto notevoli progressi. In particolare, GPT-4.1 mini supera GPT-4o in vari benchmark visivi.

Su MMMU (inclusi grafici, diagrammi e mappe), GPT-4.1 mini ha ottenuto un punteggio del 73%. Questo valore è superiore a quello di GPT-4.5 e supera di gran lunga il 56% di GPT-4o mini.
Su MathVista (che testa la capacità di risolvere problemi di immagini), sia GPT-4.1 che GPT-4.1 mini hanno ottenuto un punteggio del 57%, superando di gran lunga il 37% di GPT-4o mini.
Su CharXiv-Reasoning , dove i modelli rispondono a domande basate su grafici scientifici, GPT-4.1 continua a essere leader.
Su Video-MME (video lunghi senza sottotitoli), GPT-4.1 ha raggiunto il 72%, un miglioramento significativo rispetto al 65% di GPT-4o.

Informazioni sul prezzo:

GPT-4.1 costa 2 $ per ogni milione di token in input e 8 $ per ogni milione di token in output.
Il prezzo di GPT-4.1 mini è di $ 0,40 per l'input e di $ 1,60 per l'output.
Il GPT-4.1 nano costa 0,10 $ in input e 0,40 $ in output.

L'utilizzo della memorizzazione nella cache dei prompt o dell'API Batch può ridurre ulteriormente questi costi, il che è ottimo per le applicazioni su larga scala. OpenAI si sta inoltre preparando a interrompere il supporto per GPT-4.5 Preview il 14 luglio 2025, citando le migliori prestazioni, la minore latenza e il costo inferiore di GPT-4.1.

Tags: #openai #gpt-4.1 #modello ai #intelligenza artificiale

OpenAI annuncia Operator, un agente di intelligenza artificiale che esegue automaticamente attività per conto dellutente

L'azienda dietro ChatGPT sta svelando un nuovo modo di utilizzare l'intelligenza artificiale. OpenAI ha appena annunciato Operator, un agente di intelligenza artificiale in grado di eseguire automaticamente delle attività per te.

OpenAI lancia un nuovo strumento per aiutare gli sviluppatori a creare agenti di intelligenza artificiale

Considerando gli agenti di intelligenza artificiale come il futuro del settore dell'intelligenza artificiale, OpenAI ammette che è molto difficile creare agenti potenti, di "livello industriale" con gli strumenti attuali.

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

Resta da vedere se le affermazioni di Alibaba si avvereranno, ma sembra che ChatGPT e DeepSeek abbiano ora un nuovo degno concorrente.

OpenAI sfida Google Chrome con il suo nuovo browser

Secondo quanto riferito, OpenAI sta lavorando a un progetto di browser web che potrebbe competere direttamente con Google Chrome.

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Secondo quanto riferito, Samsung Electronics starebbe collaborando con OpenAI a un ambizioso progetto congiunto per sviluppare TV AI che integrino tecnologie di intelligenza artificiale all'avanguardia nel settore.

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

Microsoft ha investito miliardi di dollari in OpenAI dal 2019, sebbene il colosso del software con sede a Redmond non sia affatto il principale investitore nell'innovativa startup di intelligenza artificiale.

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

OpenAI è in trattativa per acquisire Windsurf, l'editor di codice basato sull'intelligenza artificiale leader del settore.

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

OpenAI ha rilasciato una versione più potente del suo modello di intelligenza artificiale basata sul ragionamento o1, o1-pro, nella sua API per sviluppatori.

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

Attualmente OpenAI offre quattro livelli di abbonamento a ChatGPT per soddisfare le esigenze di diversi gruppi di clienti.

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

Creando un progetto, gli utenti possono conservare conversazioni, file e istruzioni di personalizzazione, tutto in un unico posto. Ciò consente loro di riprendere facilmente a fare ciò che stavano facendo.

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

OpenAI ha appena annunciato il programma Pioneers, un'iniziativa volta a promuovere l'applicazione dell'intelligenza artificiale in situazioni reali.

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Il colosso degli investimenti giapponese Softbank prevede di investire dai 15 ai 25 miliardi di dollari in OpenAI. Se l'accordo andrà in porto, Softbank diventerà il maggiore investitore di OpenAI, sostituendo Microsoft, che attualmente ricopre questa posizione.

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

ChatGPT ti aiuterà a fare le cose meglio, dandoti l'opportunità di chattare direttamente con Babbo Natale.

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

Secondo The Verge, OpenAI prevede di lanciare Orion, il suo prossimo importante modello di intelligenza artificiale, a dicembre.

Come riottenere laccesso al disco rigido, correggere lerrore di impossibilità di aprire il disco rigido

In questo articolo ti guideremo su come recuperare l'accesso al tuo disco rigido in caso di guasto. Seguici!

Come utilizzare Conversation Awareness e Live Listen sugli AirPods

A prima vista, gli AirPods sembrano identici a qualsiasi altro auricolare true wireless. Ma tutto è cambiato quando sono state scoperte alcune caratteristiche poco note.

Tutto su iOS 26

Apple ha presentato iOS 26, un importante aggiornamento con un nuovissimo design in vetro smerigliato, esperienze più intelligenti e miglioramenti alle app più note.

I migliori laptop per studenti nel 2025

Gli studenti hanno bisogno di un tipo specifico di portatile per i loro studi. Non solo deve essere abbastanza potente da essere adatto al corso di laurea scelto, ma anche compatto e leggero da poter essere portato con sé tutto il giorno.

Come aggiungere una stampante a Windows 10

Aggiungere una stampante a Windows 10 è semplice, anche se la procedura per i dispositivi cablati sarà diversa da quella per i dispositivi wireless.

Come controllare la RAM e gli errori RAM sul tuo computer con la massima precisione

Come sapete, la RAM è una componente hardware molto importante in un computer: funge da memoria per l'elaborazione dei dati ed è il fattore che determina la velocità di un laptop o di un PC. Nell'articolo seguente, WebTech360 vi illustrerà alcuni metodi per verificare la presenza di errori nella RAM utilizzando un software su Windows.

Differenza tra TV normale e Smart TV

Le smart TV hanno davvero preso d'assalto il mondo. Grazie alle sue numerose funzionalità e alla connettività Internet, la tecnologia ha cambiato il nostro modo di guardare la TV.

Perché il congelatore non ha la luce mentre il frigorifero sì?

I frigoriferi sono elettrodomestici comuni nelle case. I frigoriferi hanno solitamente 2 scomparti: lo scomparto freddo è spazioso e ha una luce che si accende automaticamente ogni volta che l'utente lo apre, mentre lo scomparto congelatore è stretto e non ha luce.

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Oltre ai router, alla larghezza di banda e alle interferenze, le reti Wi-Fi sono influenzate da molti fattori, ma esistono alcuni modi intelligenti per potenziare la propria rete.

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Se vuoi tornare alla versione stabile di iOS 16 sul tuo telefono, ecco la guida di base per disinstallare iOS 17 ed effettuare il downgrade da iOS 17 a 16.

Cosa succede al corpo se mangi yogurt ogni giorno?

Lo yogurt è un alimento meraviglioso. Fa bene mangiare yogurt tutti i giorni? Se mangiassi yogurt ogni giorno, come cambierebbe il tuo corpo? Scopriamolo insieme!

Quale tipo di riso è migliore per la salute?

In questo articolo vengono illustrati i tipi di riso più nutrienti e come sfruttare al massimo i benefici per la salute offerti dal tipo di riso scelto.

Come svegliarsi puntuali la mattina

Tra le misure che possono aiutarti a dormire meglio e a svegliarti puntuale al mattino c'è quella di stabilire un orario per dormire e una routine per andare a dormire, cambiare la sveglia e modificare la tua dieta.

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Affitto per favore! Landlord Sim è un gioco di simulazione per dispositivi mobili, disponibile per iOS e Android. Giocherai nei panni del proprietario di un complesso di appartamenti e inizierai ad affittare un appartamento con l'obiettivo di migliorarne gli interni e prepararli per gli inquilini.

Ultimi codici di difesa della torre del bagno e come inserirli

Ottieni il codice del gioco Roblox Bathroom Tower Defense e riscattalo per ottenere fantastiche ricompense. Ti aiuteranno a potenziare o sbloccare torri con danni maggiori.

OpenAI annuncia GPT-4.1: il modello più intelligente per attività complesse

Leave a Comment

OpenAI annuncia Operator, un agente di intelligenza artificiale che esegue automaticamente attività per conto dellutente

OpenAI lancia un nuovo strumento per aiutare gli sviluppatori a creare agenti di intelligenza artificiale

Alibaba presenta QwQ-32b, un degno concorrente di DeepSeek

OpenAI sfida Google Chrome con il suo nuovo browser

Samsung collabora con OpenAI per sviluppare la TV AI, promettendo molte funzionalità interessanti

Microsoft continuerà a investire massicciamente in OpenAI con una valutazione di oltre 100 miliardi di dollari

OpenAI è pronta ad acquisire Windsurf, uno degli editor di codice AI più potenti al mondo

O1-pro è il modello di intelligenza artificiale più costoso di OpenAI fino ad oggi

OpenAI annuncia il piano ChatGPT Pro per ben 200 dollari al mese

OpenAI presenta i progetti ChatGPT: nuove funzionalità per organizzare conversazioni più intelligenti

OpenAI annuncia uniniziativa per creare standard di intelligenza artificiale per i settori industriali

Softbank punta a superare Microsoft e diventare il maggiore investitore di OpenAI

Gli utenti possono chattare con Babbo Natale utilizzando la modalità vocale di ChatGPT

OpenAI rilascerà Orion, il suo prossimo grande modello di intelligenza artificiale, a dicembre

Come riottenere laccesso al disco rigido, correggere lerrore di impossibilità di aprire il disco rigido

Come utilizzare Conversation Awareness e Live Listen sugli AirPods

Tutto su iOS 26

I migliori laptop per studenti nel 2025

Come aggiungere una stampante a Windows 10

Come controllare la RAM e gli errori RAM sul tuo computer con la massima precisione

Differenza tra TV normale e Smart TV

Perché il congelatore non ha la luce mentre il frigorifero sì?

2 modi per risolvere la congestione della rete che rallenta il Wi-Fi

Come eseguire il downgrade da iOS 17 a iOS 16 senza perdere dati utilizzando Tenorshare Reiboot

Cosa succede al corpo se mangi yogurt ogni giorno?

Quale tipo di riso è migliore per la salute?

Come svegliarsi puntuali la mattina

Suggerimenti per giocare a Rent Please! Simulazione del proprietario di casa per principianti

Ultimi codici di difesa della torre del bagno e come inserirli