Home
» Come fare
»
Google Labs lancia Whisk: uno strumento che consente di caricare immagini come istruzioni anziché come prompt di testo
Google Labs lancia Whisk: uno strumento che consente di caricare immagini come istruzioni anziché come prompt di testo
Gli strumenti di generazione di immagini basati sull'intelligenza artificiale ci deliziano ormai da anni, grazie a OpenAI, Imagen, Adobe Firefly, DALL-E-3 , ecc. Con l'evoluzione della tecnologia, abbiamo sempre più opzioni per perfezionare i nostri risultati. Ora Google Labs ha rilasciato Whisk, uno strumento che consente di caricare immagini come istruzioni anziché come messaggi di testo.
Whisky di Google Labs crea immagini da altre immagini
Se vivi negli Stati Uniti, ora avrai accesso a Whisk di Google Labs, un "esperimento di intelligenza artificiale generativa", secondo il blog di Google. Con Whisk, invece di affidarti solo a prompt di testo descrittivi, puoi aggiungere immagini come riferimenti. La piattaforma richiederà 3 caratteristiche principali: tema, scena e stile. Lo strumento unirà quindi questi elementi e creerà l'immagine perfetta per te.
Nota : Whisk utilizza Imagen 3, l'ultimo modello di generazione di immagini di Google.
Google non ha ancora eliminato del tutto i prompt di testo con Whisk. Hai ancora la possibilità di scrivere un prompt per la creazione di immagini per ciascuna delle 3 categorie oppure di aggiungere una nota generale. Dopo aver visualizzato il primo test Whisky, è anche possibile modificare l'immagine. Ad esempio, immaginiamo di creare un biglietto d'auguri in stile vintage raffigurante un gatto sdraiato sulla neve. Dopo aver visto il risultato, potresti avere l'idea di aggiungere dei fiocchi di neve per il tocco finale.
Ogni volta che aggiungi o crei un'immagine in una qualsiasi delle 3 categorie di Whisk, la piattaforma genera una descrizione testuale dettagliata di quell'immagine. Quindi, se vuoi aggiungere o modificare un'immagine esistente, puoi semplicemente personalizzare il testo.
Il dialogo di testo sulla piattaforma di generazione di immagini AI Whisk consente la modifica automatica dei prompt di testo
Infine, se ti manca l'ispirazione, puoi randomizzare i tuoi elementi visivi scegliendo un'icona a forma di dado. Per creazioni più complesse, puoi anche aggiungere più di un tema, una scena o un riferimento di stile.
Una volta che sei soddisfatto del tuo capolavoro, puoi salvarlo sulla piattaforma o scaricarlo per accedervi in locale.
Vale la pena usare Whisky?
Considerando tutte le opzioni avanzate di elaborazione delle immagini basate sull'intelligenza artificiale disponibili per migliorare le foto o creare opere d'arte "originali", il nuovo strumento di Google potrebbe sembrare una trovata pubblicitaria. Ma il modo in cui Whisk sfrutta i riferimenti visivi nel suo processo di creazione delle immagini è unico, e si può notare quanto possa essere prezioso in situazioni creative e professionali.
Supponiamo che tu stia lavorando a un pitch deck e ti servano immagini simili a un riferimento che già possiedi. Invece di provare a fare il reverse engineering di quel riferimento verbalmente, carica semplicemente il file insieme a una breve descrizione testuale di come desideri che sia diversa la tua nuova immagine.
Per differenziare Whisk dagli altri software di imaging basati sull'intelligenza artificiale esistenti, Google ha chiarito che la piattaforma è progettata per la scoperta, non per il perfezionamento. Sebbene altri prodotti possano essere più adatti alla messa a punto, Whisk è più adatto al brainstorming:
"L'abbiamo progettato per un'esplorazione visiva rapida, non per un editing impeccabile al pixel. Whisk permette di esplorare le idee in modi nuovi e creativi, permettendoti di sperimentare con decine di opzioni e di scaricare le tue preferite."
Sinceramente a volte è difficile esprimere le cose a parole. Whisky offre nuove potenzialità quando semplicemente "si desidera che un'immagine abbia questo aspetto".