Opere generate in AI e pecore elettriche
Cosa sono e come si creano le opere generate in AI? E cosa succede all’art direction, quando incontra l’intelligenza artificiale? Se l’è chiesto Nicola Cellemme, Executive Creative Director di Armando Testa Milano e socio ADCI, che in questo articolo condivide con noi le sue riflessioni sulle prime sperimentazioni con i nuovi sistemi di generazione di immagini attraverso l’uso dell’intelligenza artificiale.
Pensiero, magia, futuro
Immagina un sistema che trasforma i tuoi sogni e i tuoi pensieri in un’immagine, via Wi-Fi. In 60 secondi. Sarebbe pazzesco.
Pensi “Farfalla di patatine” e bum. Senza pennelli, matita, senza penna grafica, niente pantoni o pennarelli Giotto.
Sessanta secondi e quell’immagine esiste.
Lettura del pensiero, magia, futuro. Ecco alcune delle parole che ti saltano in testa la prima volta che provi un programma di creazione di immagini via intelligenza artificiale. Wow.
Un’altra. Subito. Che faccio?
“Fat Batman black and white”.
Sarà fighissimo.
Urca ma allora sono bravo! Posso diventare un… Aspetta un attimo.
Ma bravo a fare cosa?
L’AI per generare immagini oniriche a partire da input testuali
Queste immagini le ho fatte io? Da dove arrivano?
Perché la gente mi commenta “wow good work!” “Love your style”, e a ben guardare queste cose non le ho fatte io, ok però le ho pensate. Ho usato bene lo strumento forse…
No. Non mi convince, non avrei mai pensato a “Butterfly made of French fries” se non mi fossi trovato davanti a quel prompt. Dovevo scrivere qualcosa e ho scritto qualcosa di strano.
Facciamo un attimo di ordine, di cosa stiamo parlando?
Da qualche mese su internet si sta sperimentando, in maniera massiva, una nuova forma di intelligenza artificiale, capace, come in un film di fantascienza, di generare un’immagine, spesso onirica, sulla base di input testuali che riceve dall’utente. Il software genera una o più versioni dell’immagine (a seconda del software che si sta usando) e ti concede qualche affinamento o addirittura la totale rilavorazione dell’input iniziale.
Programmi di AI per la generazione di immagini: quali sono?
Per ora i software per la generazione di illustrazioni attraverso l’intelligenza artificiale si contano sulle dita delle mani:
- MidJourney (disponibile su Discord in fase di sviluppo beta) è il più usato essendo stato il primo ad aprirsi al grande pubblico;
- Stable Diffusion che sembra avere un livello di complessità più profondo ma anche un dialogo utente-Bot meno immediato con una resa più tecnica e meno poetica (ndr.: ora disponibile anche su MidJourney);
- Imagen del gigante Google che ancora pochi hanno visto in azione;
- DALL-E 2 da cui ci si aspetta molto nel prossimo futuro e che per ora sembra l’unico a produrre volti talmente realistici da sembrare… veri.
Io per ora ho provato MidJourney e la versione mini di DALL-E che però lascia molto a desiderare.
Come funziona e quanto costa generare immagini AI?
Come funziona? Intanto paghi. Se no ti fermi dopo pochi esperimenti free, as usual. Paghi poco (10€ al mese per 200 creazioni, ci sta considerando il numero di server che alimenta questo artista virtuale), o 30 per farne un uso libero. Da notare che, pagando, anche i diritti commerciali dell’immagine generata rimarranno tuoi.
Poi devi confrontarti con un’interfaccia decisamente macchinosa in cui devi inserire i tuoi pensieri e dare indicazioni di massima o di dettaglio secondo le tue volontà. Volendo puoi anche linkare immagini di riferimento dal web. Il software ti restituisce l’immagine in 4 versioni a volte molto diverse. A volte meno. Qui puoi scegliere se mandare in sviluppo in alta risoluzione (Upscale) o creare varianti (Variation) di una o più delle 4 miniature proposte.
E così. Avanti. Sorprendendoti ogni volta di come l’intelligenza artificiale stia interpretando le tue parole.
Puoi ottenere un’illustrazione magnifica di un mondo post-atomico (va per la maggiore a quanto pare), grafica astratta, loghi, ritratti foto realistici di persone che non esistono o animali fantastici più o meno degni di un romanzo di Tolkien.
Tipo i miei pesciolini Marshmallow a cui un po’ mi sono anche affezionato.
Onestamente stupefacente. Non il pesce marshmallow. L’intelligenza artificiale intendo.
L’ordine è sconvolto
Guardarlo creare i tuoi pensieri fa una certa impressione, ed è anche addictive. Scrivi, schiacci e aspetti che faccia la magia: sarà come l’ho pensato io? Sarà meglio? Farà impressione?
E qui si torna al dubbio iniziale. Uno dei tanti.
Siamo abituatissimi a risolvere in un’immagine un intero brief. E mai un art director inizierà a disegnare senza avere ben chiaro in testa il risultato. Lo pensi mentre lo immagini, poi lo disegni.
Come lo avevi pensato.
Ecco qui l’ordine è sconvolto: pensi, scrivi i tuoi pensieri, qualcun altro immagina al posto tuo, vedi un risultato. Risultato stupefacente, il più delle volte. Che difficilmente avresti pensato tu in prima persona. E inizi a chiederti se quell’immagine sia in effetti tua, se ti appartiene, se è unica.
Come per le stampe in serie di Warhol, il concetto di unicità e proprietà vacilla.
Inizi anche a chiederti cosa sarà questa tecnologia tra 5-10 anni. Video, foto composizione, audio? Faremo le canzoni così? Le foto delle vacanze senza scattarle?
Le campagne targettizzate anche visivamente?
Più nel concreto del nostro mestiere è chiaro che tra poco le banche immagini avranno vita dura se non sbarcano su questo nuovo mondo. Chi passerà più un’ora a trovare “an old woman sitting on a bench in a park under the rain” se puoi crearla tu in tempo zero senza nemmeno aprire Photoshop?
Faccio questo lavoro da 15 anni e siamo già alla terza rivoluzione dell’immagine digitale, che fatica…
Above us, only sky
Altra domanda esistenziale: tra quanto potremo fare questo giochino senza nemmeno scrivere gli input?
Direttamente dalla mente e soprattutto direttamente dai nostri big data?
Tanto quelli là sanno già tutto no? Mi piacciono le cose allegre o tristi? I cani o i gatti?
Ed ecco che i professionisti del nostro mestiere sono chiamati a capire come questo nuovo mezzo di generazione di visual possa diventare a breve un geniale e cinico tool di conversion, un modo per far sognare o magari un tappeto rosso per la Croisette.
Rimane il dubbio: questo nuovo tool sarà l’ennesima meteora nel cielo stellato della tecnologia creativa, come gli NFT, oppure il primo seme di una nuova quotidianità che inizieremo a subire e usare nel prossimo futuro? Onestamente, e a livello del tutto personale, usandolo posso confermare di essere rimasto sconvolto e sorpreso e di essermi divertito parecchio. Dopo un inizio di “grandioso, posso fare cose spettacolari senza sforzo” ho capito che, come per gli spartiti musicali, devi imparare a leggere e scrivere una lingua complessa, devi imparare a comunicare con un’intelligenza artificiale, con un bot, capendo la sua “mente” e facendo in modo che lui capisca la tua.
E questa probabilmente è la cosa più affascinante di questa nuova frontiera, qualcosa che abbiamo desiderato da Blade Runner in avanti (“gli androidi sognano pecore elettriche?” ricordate?), e che ora sembra possibile.
Quindi non ci resta che esplorare e divertirci, imbarcarci in questa esperienza onirica, cercando di capirne i limiti fino a espanderli fin dove possiamo.
Nel frattempo, ecco un Golden Lion made in AI di buon auspicio!
Nicola Cellemme