Home
» Wiki
»
Perché lintelligenza artificiale non riesce a scrivere testo sulle immagini?
Perché lintelligenza artificiale non riesce a scrivere testo sulle immagini?
Se hai utilizzato strumenti di intelligenza artificiale generativa per creare immagini, potresti aver riscontrato problemi nella scrittura del testo nelle immagini. Sapere perché ciò accade aiuterà a evitare il problema e a trovare soluzioni.
Perché l'intelligenza artificiale non riesce a scrivere testo nelle immagini?
Il motivo principale per cui l'intelligenza artificiale non riesce a scrivere testo è dovuto ai dati di input precedenti. Sebbene l'intelligenza artificiale sia in generale piuttosto efficace nel generare immagini, alcuni aspetti, come il testo, non sono stati utilizzati allo stesso livello per addestrare modelli linguistici di grandi dimensioni (LLM) . Per questo motivo, l'intelligenza artificiale non è molto abile nel generare testo nelle immagini.
Sebbene siano piuttosto avanzati, dal punto di vista tecnico gli strumenti di intelligenza artificiale sono ancora in una fase iniziale. Inoltre, alcuni strumenti di intelligenza artificiale stanno esaurendo i dati di addestramento. C'è ancora la possibilità che gli strumenti generatori riescano a generare un testo migliore, ma per ora dovrai provare un'alternativa.
Esiste un'alternativa al testo illeggibile nelle immagini create dall'intelligenza artificiale?
Anche se generare testo nelle immagini create dall'intelligenza artificiale è piuttosto difficile, non è impossibile. Ecco i metodi più efficaci al momento...
1. Fornire allo strumento richieste più specifiche
Quando le persone iniziano a usare l'intelligenza artificiale, le loro capacità di scrittura rapida sono spesso scadenti. L'errore più grande è dare suggerimenti vaghi come "crea un'immagine di una scena di strada".
Non c'è da stupirsi se i risultati ottenuti sono mediocri. Il modo migliore per utilizzare l'intelligenza artificiale generativa è pensare al prompt come a un brief creativo. Più è specifico, meglio è. Ecco un esempio di richiesta:
Crea un'immagine dell'esterno di un bar italiano. Vorrei che ci fosse la scritta "Café" come insegna e che fosse esposta in una giornata di sole.
Traduzione approssimativa : Crea un'immagine esterna di un bar italiano. Voglio che l'immagine riporti la scritta "Café" sul cartello e in una giornata di sole.
Come puoi vedere dall'immagine qui sotto, ChatGPT ha avuto un buon successo. Questo non accadrebbe se dicessi semplicemente "Crea un'immagine esterna di un bar italiano".
Immagine di una caffetteria creata in DALL-E
Nell'esperienza personale, le immagini semplici sembrano essere più efficaci. Ad esempio, l'immagine sopra ha meno elementi rispetto all'immagine testata qui sotto, il che significa che l'IA ha meno cose da provare e imparare.
Una scena di strada modificata nell'app DALL-E 3
2. Utilizzare varianti della parola "Testo"
Cambiare leggermente la lingua del messaggio può fare una grande differenza. Dopo aver provato il termine "testo" un paio di volte, inizierai ad avere la sensazione di girare in tondo, quindi prova diversi sinonimi.
Ad esempio, invece di "testo", potresti provare:
Titolo
Alfabeto
Parola scritta
Simbolo
Se nessuna di queste soluzioni funziona, continua a provare soluzioni alternative. Ciò che funziona e ciò che non funziona può variare a seconda di ciò che si sta cercando di creare. Ad esempio, probabilmente non useresti la parola "simbolo" se volessi progettare un biglietto di auguri per un compleanno. In questo caso è fondamentale sperimentare diverse idee di ispirazione AI, e diversi strumenti possono funzionare in modi diversi.
3. Aggiungi testo utilizzando gli strumenti di sostituzione
Non dovresti aggiungere testo tramite gli strumenti di sostituzione se le parole devono far parte dell'immagine, ma è una buona idea se stai cercando di creare più elementi grafici. Funzionerà se vuoi progettare una cartolina, una grafica, la copertina di un libro o qualcosa di simile.
Se decidi di fare ciò, assicurati che ci sia abbastanza spazio nell'immagine. Per aggiungere del testo all'immagine puoi usare qualsiasi strumento tu voglia. Canva o Adobe Photoshop Express sono le opzioni consigliate, ma anche altre app che consentono di aggiungere testo alle immagini sullo smartphone funzionano con i contenuti creati utilizzando l'intelligenza artificiale.
Dovresti anche assicurarti che il testo corrisponda all'immagine generata dall'intelligenza artificiale. Utilizza font che corrispondano allo stato d'animo che vuoi trasmettere e modifica le cose come ritieni necessario.
4. Mantieni il testo breve
Spesso la generazione di testo di immagini tramite intelligenza artificiale fallisce perché si cerca di aggiungere troppo testo. Onestamente, questo accade ogni volta che si tenta di creare qualcosa di più lungo di 10 caratteri. Similmente a quanto raccomandato per le immagini semplici, dovresti fare tutto il possibile per rendere breve il testo.
Per testarlo, l'autore ha provato un altro prompt:
Si prega di generare un'immagine di una banca con la scritta "bank" all'esterno. Voglio che si trovi in un centro città e che abbia una struttura moderna, come quelle che si vedono in una città degli Stati Uniti.
Traduzione approssimativa : Crea l'immagine di una banca con la parola "banca" all'esterno. Volevo che fosse in centro e che avesse una struttura moderna, come quelle che si vedono in una città americana.
Come puoi vedere di seguito, il motore di intelligenza artificiale ha fatto un ottimo lavoro nell'ascoltare l'utente. Tuttavia, ci sono alcuni errori in una parte dell'immagine. Quindi, dì all'IA che vuoi solo uno o due segnali per limitare le possibilità che ciò accada. Questi problemi sembrano verificarsi anche quando il testo è più piccolo, quindi tenetelo a mente.
Immagine di un edificio moderno creata in DALL-E
5. Utilizzare strumenti per correggere gli errori di testo
Così come puoi rimuovere i difetti dalle foto scattate con la tua macchina fotografica, puoi provare a usare uno strumento che ti aiuta a correggere gli errori di testo nelle foto. Esistono molte app che correggono il testo incomprensibile nelle foto generate dall'intelligenza artificiale, come Storia Lab.
Errore dello strumento Textify AI di Storia Lab
Quando si utilizzano questi strumenti, in genere è possibile selezionare il testo e modificarne il contenuto a seconda delle esigenze. Alcune app sono gratuite, ma in altri casi è necessario un abbonamento a pagamento. Se crei molte immagini con l'intelligenza artificiale, puoi acquistare un abbonamento mensile o annuale per accedervi ogni volta che ne hai bisogno.
6. Utilizzare strumenti di intelligenza artificiale per generare testo accurato
Forse avrai sentito parlare di Midjourney , DALL-E, Firefly e generatori di immagini AI simili. Ma sapevi che esistono specifici generatori di intelligenza artificiale in grado di generare testi accurati nelle immagini?
Dal momento che una delle caratteristiche peculiari di Ideogram è la creazione di testo leggibile, puoi sicuramente provare questa app per alcune delle tue creazioni. Ideogram ha una funzione Magic Prompt che amplia la funzione originale, consentendoti di ottenere risultati ancora più precisi. Oltre al piano gratuito, sono disponibili piani di abbonamento a pagamento a partire da $ 8 al mese.
Anche se l'intelligenza artificiale ha i suoi limiti nel creare immagini con testo leggibile, se si è disposti a pensare fuori dagli schemi si possono trovare alcune alternative. A volte la soluzione migliore è fornire al tuo strumento dei prompt dettagliati, meno lunghi da elaborare. Potresti anche voler correggere i problemi delle tue immagini con altri software o utilizzare strumenti progettati specificamente per creare testo accurato.