OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

OpenAI ha appena introdotto ufficialmente un notevole aggiornamento alla capacità di generazione di immagini AI in ChatGPT, un importante passo avanti rispetto all'utilizzo di un modello di generazione di immagini separato come il precedente DALL-E. Questa nuova funzionalità è stata integrata direttamente in GPT-4o, apportando notevoli miglioramenti.

Superare i limiti intrinseci

Sebbene molti attuali modelli di generazione di immagini basate sull'intelligenza artificiale siano in grado di creare immagini artistiche di grande effetto, spesso hanno difficoltà con elementi come testo, loghi o oggetti di uso quotidiano. OpenAI sostiene che il nuovo GPT-4o può superare queste limitazioni grazie alla sua capacità di:

  • Visualizzare correttamente il testo
  • Rispettare rigorosamente i requisiti dell'utente
  • Sfruttare le conoscenze di base e il contesto conversazionale
  • Permette la modifica delle foto caricate o la creazione di nuove foto basate sulle foto originali
  • Ampiamente disponibile

Questa nuova funzionalità è attualmente in fase di distribuzione per gli utenti di ChatGPT Free, ChatGPT Plus, Pro e Team e sarà disponibile anche per ChatGPT Enterprise ed Edu nelle prossime settimane. In particolare, questo sarà lo strumento di creazione delle immagini predefinito in ChatGPT, rendendolo facilmente accessibile per gli utenti senza opzioni aggiuntive. Gli utenti possono personalizzare le foto con:

  • Rapporto d'aspetto specifico
  • Colore esatto (utilizzando il codice esadecimale)
  • Sfondo trasparente
  • Supporto multipiattaforma

OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

Oltre a ChatGPT, questa funzionalità sarà disponibile anche su piattaforme come Sora (generazione di immagini), DALL·E GPT dedicato e API GPT-4o (per sviluppatori, il cui lancio è previsto nelle prossime settimane).

Nonostante le promesse di numerosi miglioramenti, il nuovo modello presenta ancora alcune limitazioni:

  • Il tempo di generazione dell'immagine può arrivare fino a 1 minuto a causa dell'elevato dettaglio
  • Ritagli indesiderati con foto verticali
  • A volte "fabbricano" informazioni con poco contesto richiesto
  • Difficoltà nell'elaborare più di 10-20 concetti contemporaneamente
  • Difficoltà con le lingue non latine
  • Le correzioni dettagliate (come gli errori di ortografia) non sono molto efficaci
  • Difficile visualizzare informazioni dettagliate in piccole dimensioni

Tutte le immagini generate da GPT-4o conterranno metadati C2PA, consentendo la verifica della provenienza tramite gli strumenti interni di OpenAI.

Nonostante alcune limitazioni, GPT-4o promette di fornire immagini più precise e personalizzabili. OpenAI afferma che continuerà a migliorare il modello nei prossimi mesi, aprendo nuove possibilità per la creazione di contenuti visivi basati sull'intelligenza artificiale.

Con questo importante aggiornamento, OpenAI continua a rafforzare la propria leadership nella corsa all'intelligenza artificiale creativa, offrendo agli utenti un'esperienza più fluida e potente su più piattaforme.

Sign up and earn $1000 a day ⋙

Leave a Comment

8 principali svantaggi degli smartphone con schermo pieghevole che non ti aspettavi

8 principali svantaggi degli smartphone con schermo pieghevole che non ti aspettavi

Non si può negare che i telefoni pieghevoli siano davvero fantastici. Ma dopo un po' di utilizzo, questo dispositivo inizia a presentare alcune stranezze. Ecco 5 svantaggi principali dei telefoni con schermo pieghevole che non ti aspetteresti!

Adobe porta la tecnologia di creazione video basata sullintelligenza artificiale su Premiere Pro

Adobe porta la tecnologia di creazione video basata sullintelligenza artificiale su Premiere Pro

Adobe ha reso accessibile al grande pubblico la tecnologia di creazione video basata sull'intelligenza artificiale in un modo del tutto nuovo, anche se non ha ancora creato un film completo utilizzando questa tecnologia.

Ultimi codici di Genshin Impact di aprile 2025

Ultimi codici di Genshin Impact di aprile 2025

Il codice Genshin Impact 5.5 ti aiuta a ottenere Pietre Primordiali, Minerali Magici, esperienza e molte altre ricompense.

Come trasformare il tuo iPad in un display Mac aggiuntivo

Come trasformare il tuo iPad in un display Mac aggiuntivo

macOS Catalina e iPadOS includono il supporto per una nuova funzionalità chiamata Sidecar, progettata per consentirti di usare il tuo iPad come display secondario per il tuo Mac.

Sfondo 1280, bellissimo sfondo del telefono Nokia 1280

Sfondo 1280, bellissimo sfondo del telefono Nokia 1280

Questo è un set di sfondi per Nokia 1280. Se hai mai inviato un messaggio per ottenere sfondi per 1280, sfondi per telefoni con mattoncini, prova a dare un'occhiata a questi sfondi.

Laereo spaziale ipersonico raggiunge la velocità di 11.115 km/h

Laereo spaziale ipersonico raggiunge la velocità di 11.115 km/h

Venus Aerospace ha rivelato le prime immagini del suo nuovo aereo ipersonico chiamato Stargazer, che può raggiungere una velocità massima di 11.115 km/h, pari a Mach 9.

Mangiare banane a colazione aiuta a ridurre il gonfiore

Mangiare banane a colazione aiuta a ridurre il gonfiore

Il gonfiore può capitare a chiunque. La buona notizia è che la colazione è il momento ideale per aggiungere al pasto alcuni ingredienti che aiutano a ridurre il gonfiore. L'ingrediente in questione è la banana.

OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

OpenAI annuncia un importante aggiornamento per la generazione di immagini AI in ChatGPT

OpenAI ha appena introdotto ufficialmente un notevole aggiornamento alla capacità di generazione di immagini AI in ChatGPT, un importante passo avanti rispetto all'utilizzo di un modello di generazione di immagini separato come il precedente DALL-E.

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

Deepseek rilascia il modello di linguaggio gratuito v3 che funziona bene sulle configurazioni hardware comuni

La startup cinese di intelligenza artificiale DeepSeek ha appena rilasciato ufficialmente il suo ultimo modello linguistico di grandi dimensioni (LLM), DeepSeek-V3-0324.

Motivi per abbandonare Gboard e passare alla tastiera Samsung

Motivi per abbandonare Gboard e passare alla tastiera Samsung

Gboard è da tempo la tastiera preferita sui telefoni Android. Tuttavia, di recente molte persone sono passate alla tastiera Samsung e non se ne sono più pentite.

Dolci e romantici auguri di fine settimana per gli innamorati

Dolci e romantici auguri di fine settimana per gli innamorati

Invia dolci e romantici auguri di buon fine settimana alla tua dolce metà. Sebbene siano solo parole o messaggi, saranno doni spirituali significativi, che contribuiranno a rafforzare la vostra relazione.

La serie TV di Harry Potter ha bisogno dei seguenti elementi per avere successo

La serie TV di Harry Potter ha bisogno dei seguenti elementi per avere successo

Il remake di Harry Potter della HBO dovrebbe debuttare nel 2026. Ecco cosa rende la serie TV di Harry Potter un successo.

Immagini mozzafiato della superluna da tutto il mondo

Immagini mozzafiato della superluna da tutto il mondo

Non è raro trovare su Internet delle belle foto della luna. L'articolo riassumerà per voi le più belle immagini della luna del mondo.

Gli utenti AMD Ryzen dovrebbero installare questo aggiornamento del BIOS per un aumento gratuito delle prestazioni

Gli utenti AMD Ryzen dovrebbero installare questo aggiornamento del BIOS per un aumento gratuito delle prestazioni

Ora AMD ha risposto ai problemi della sua linea di CPU di punta dalle prestazioni inferiori alle aspettative con un nuovo aggiornamento che potrebbe garantire qualche frame al secondo in più.

Il valore di X scende da 44 miliardi di dollari a meno di 10 miliardi di dollari

Il valore di X scende da 44 miliardi di dollari a meno di 10 miliardi di dollari

Nell'ottobre 2022, Elon Musk ha speso 44 miliardi di dollari per acquisire X, ma ad oggi il valore della piattaforma è sceso del 78,6%, attestandosi a circa 9,4 miliardi di dollari.