Intelligenza Artificiale e fotografia #1: cosa sta succedendo?

Che ci piaccia o no, da fotografi avremo sempre più a che fare con l’Intelligenza Artificiale. Ultimamente se ne sta parlando molto, ma… cosa sta succedendo veramente? Cerchiamo di fare un po’ di chiarezza inquadrando la situazione. Pronti per l’esplorazione? Allacciamo le cinture perché ce n’è bisogno…


Quando, subito prima di Natale, ho pubblicato su Facebook una rara foto di Nancy Cunard scattata da Andy Warhol nel 1985, c’è stato qualche like, alcuni commenti, ma nessuno ha messo in dubbio che la foto fosse autentica. Dopotutto, si stima che – tra i primi anni 70 e la sua morte – Andy Warhol abbia scattato oltre 130.000 istantanee in bianco e nero e circa 20.000 polaroid. Una immagine mai vista prima non sarebbe così strana.

Nancy Cunard fotografata da Andy Warhol?

Qualche ora più tardi ho pubblicato un raro ritratto di Nancy Cunard scattato da Annie Leibovitz nel 2019. Questa foto era davvero un po’ sospetta: molto vicina (era un particolare?), niente ambientazione…. Però, forse perché la faccia del soggetto era più vecchia rispetto allo scatto precedente, forse perché la luce e i colori ricordavano vagamente lo stile della maestra americana o forse perché una foto su Facebook si guarda molto velocemente, anche in questo caso nessuno ha espresso alcun dubbio sulla sua autenticità. Perché mai avrebbero dovuto? Anche Annie Leibovitz ha una produzione di immagini molto considerevole ed è difficile ricordarle tutte. Inoltre, in genere, io non tendo questi trabocchetti.

Nancy Cunard fotografata da Annie Leibovitz?

Solo di sera, ho svelato che quelle immagini erano così rare e non le aveva mai viste nessuno perché… erano state create il giorno prima dall’intelligenza artificiale istruita da me. Proprio così, Nancy Cunard (che, per inciso, ha lasciato questo mondo nel 1965 e non avrebbe potuto essere fotografata né nel 1985, né nel 2019) è invece stata fotografata da Man Ray e, a quel punto, ho pubblicato su Facebook un famoso ritratto del 1926.

© Man Ray. Nancy Cunard. 1926

Questa burla innocente, fatta con leggerezza, mi ha poi portato riflettere molto (e a documentarmi). Ormai sono in tanti a dilettarsi nella generazione di immagini utilizzando strumenti disponibili online che possono essere istruiti con dei brevi testi.

La creazione di immagini realiste con AI (Artificial Intelligence) è talmente comune e abbiamo già perso la capacità di riconoscere una fotografia che ha richiesto la presenza di un soggetto da una pseudo-fotografia che è frutto della fantasia di una macchina. Oltretutto, io l’ho fatto in pochi minuti senza alcuna conoscenza del mezzo, ma c’è chi sa generare immagini molto molto bene.

Alcune immagini della serie “Fashion Show For Elders” e generate con AI da Malik Afegbua

Per esempio Malik Afegbua, regista nigeriano che con la sua casa di produzione Slick City ha dato vita, tra l’altro, ad immagini diventate virali in un batter d’occhio. Si tratta di una sfilata di moda mai accaduta, eppure sul web in tanti hanno pensato che si trattasse delle foto scattate in passarella.

Come metterà a frutto la sua capacità di utilizzare l’Intelligenza Artificiale? In una intervista ad Essence ha dichiarato: “Sono uno scrittore, e anche mia moglie, Ese. Scrive film e sceneggiature. E i film che scriviamo non sono il genere di cose che possiamo permetterci di produrre. Avremmo bisogno di un grande studio, personale, ogni sorta di spese generali. Un giorno ci arriveremo, ma quello che ho scoperto è che possiamo creare davvero tanto usando la tecnologia”.

Ho deciso di fargli anche io qualche domanda.

Dopo il successo di queste immagini, state ricevendo delle richieste di collaborazioni?

“Sì e con la mia casa di produzione Slick City ora offriamo come servizio ai clienti la nostra competenza in materia”

Come fate ad ottenere delle immagini così d’impatto?

“Generiamo le immagini sia in locale che sul Cloud. A volte, poi, io continuo le correzioni e manipolazioni in Photoshop e Lightroom.”

Qual è l’aspetto più importante di questa esperienza?

“Essere capaci di immaginare mondi e personaggi e poi riuscire a creare questi mondi. Le possibilità sono infinite. Anche essere capaci di condividere delle storie con le quali le persone possono entrare in sintonia.”

Alcune immagini della serie “The Elders At The Beach” e generate con AI da Malik Afegbua

Le immagini generate da Malik Afegbua sono estremamente ben fatte ed occorre una buonissima padronanza del mezzo per ottenere questi risultati. Io, senza avere alcuna esperienza nella generazione di immagini, ho comunque provato a realizzare altre “foto”. Finché si tratta di ritratti, i risultati possono essere sorprendentemente convincenti.

Per esempio, sembra di percepire lo stato d’animo degli atleti ultracinquantenni iraniani o delle panettiere indiane che ho chiesto di generare. Eppure non sono fotografie. Ho scritto nelle mie istruzioni (prompt) di creare dei ritratti come se fossero stati scattati con un obiettivo 85mm f/1:2.

Ho anche provato a chiedere di creare immagini più complesse, oppure con più persone, ma in quei casi i dati da processare erano troppi, io non sono abbastanza esperto e i risultati sono stati pessimi.
Poi ho cercato di creare un ritratto di Nancy Cunard come se lo avesse disegnato Leonardo Da Vinci a sanguigna. Ho provato sia su DALL-E che su Midjourney che su Stable Diffusion (le tre principali piattaforme che permettono di generare immagini) ed ho sperimentato tante descrizioni diverse, ma non c’è stato niente da fare. Ho chiesto ad alcuni esperti che ho intervistato una spiegazione e quello che mi hanno spiegato è complesso e anche un po’ inquietante. Lo vedremo nella terza e nella quarta puntata.

“Fotografie” generate da AI

La tecnologia si evolve con una velocità esponenziale e fra non molto sarà facile ottenere ciò che adesso non dà ancora risultati soddisfacenti. Le implicazioni sono enormi. Il fatto che per realizzare fotografie non ci sia più necessariamente bisogno di un vero fotografo non è una novità (filtri, post-produzione…), ma ora stiamo parlando di fotografie senza soggetti e senza scatti: nessuna spesa di produzione, nessuna rogna di diritti di utilizzo con i modelli, nessuna ricerca preliminare. Solo un’immagine creata da una descrizione scritta. Però… le immagini non si creano proprio da sole. L’intelligenza artificiale ha bisogno di imparare come crearle analizzando immagini esistenti. Da dove vengono queste ultime?

Prima di addentrarci sulla provenienza delle foto che oggi alimentano l’AI, facciamo un passo indietro. Ricordi gli articoli che ho scritto nel 2019 nei quali esploravo l’utilizzo dell’Intelligenza Artificiale? Già in quell’occasione descrivevo la creazione di Frankestein virtuali assolutamente credibili. Se non li hai letti, ti suggerisco di farlo adesso perché aiutano a capire la situazione odierna: I Fotografi Sono Obsoleti? e Dai Ritratti Di Persone Che Non Esistono in Poi. Ti suggerisco anche l’articolo La Fotografia e la AI nel quale Giorgio Rossi affronta l’argomento in modo diverso da me ed è sempre interessante esplorare un tema da più punti di vista.

E ora passiamo a quello che sta succedendo adesso.

Le agenzie di Stock cominciano a vendere immagini AI

Il 25 ottobre 2022, l’agenzia di foto stock Shutterstock ha annunciato un accordo con OpenAI per offrire ai propri clienti la possibilità di generare istantaneamente immagini partendo da una descrizione scritta. OpenAI è la società che ha creato DALL-E 2, il nuovo sistema di intelligenza artificiale di cui si è parlato molto negli ultimi tempi proprio perché trasforma una frase in un’immagine.

Per i clienti di Shutterstock, in pratica, non si tratterà più di ricercare in una banca di immagini tra fotografie scattate da fotografi, ma di impostare le caratteristiche che si desiderano trovare nell’immagine che l’Intelligenza Artificiale genererà all’istante. Al momento della pubblicazione di questo articolo, c’è una lista d’attesa per accedere al servizio.

Per generare nuove immagini, l’Intelligenza Artificiale ha bisogno di “imparare” acquisendo una grande quantità di dati, ovvero milioni di fotografie scattate da esseri umani. E qua torniamo alla domanda che avevamo lasciato in sospeso: da dove provengono le immagini date in pasto all’Intelligenza Artificiale? Nel caso di Shutterstock, si tratta del materiale dei fotografi che rappresentano.

Naturalmente, le preoccupazioni non sono poche: nonostante Shutterstock intenda riconoscere un compenso economico ai fotografi per avere permesso di istruire l’Intelligenza Artificiale, man mano che il mezzo si perfezionerà si teme che ci sarà sempre meno bisogno di contributi umani. Ho domandato ad un fotografo rappresentato da Shutterstock se si tratta di un compenso soddisfacente e sembra che, per il momento, i termini siano ancora un po’ vaghi.

Dopo Shutterstock, il 5 Dicembre anche Adobe Stock ha annunciato un reparto dedicato alle immagini create con AI (per il momento non permettono ai clienti di generarle da soli) e, probabilmente, altri seguiranno.

Da dove vengono le foto usate per allenare l’Intelligenza Artificiale?

A questo punto, qualcuno a cominciato a domandarsi: siamo proprio sicuri che l’intelligenza artificiale venga nutrita solo da una selezione precisa di immagini e non da altre? Così, per togliersi ogni dubbio, l’artista digitale canadese Eric Bourdages ha provato a chiedere a Midjourney (una delle piattaforme di Intelligenza Artificiale che approfondiremo più avanti) di creare delle immagini con Topolino e i risultati sono sorprendentemente simili all’originale.

L’intento di Eric Bourdages è di sollevare l’interrogativo: è giusto che si lucri sulla vendita di un programma che funziona grazie all’acquisizione del frutto del lavoro di migliaia di artisti che (a parte i fotografi di Shuttertock) non verranno ricompensati? Come provocazione, il 10 dicembre l’artista canadese ha pubblicato su Twitter due immagini ed ha suggerito ai suoi follower di sfruttarle commercialmente

Qualcuno rubi questi fantastici disegni per venderli su tazze e magliette, non mi interessa, questa è arte generata dall’Intelligenza Artificiale. Dal punto di vista legale non ci dovrebbe essere alcun ricorso da parte della Disney poiché – secondo i Termini Di Servizio dei modelli AI – queste immagini trascendono il copyright e sono di pubblico dominio.

Midjourney non l’ha presa tanto bene ed ha sospeso (e rimborsato) l’abbonamento di Eric Bourdages. Ma ormai il caso era esploso e molti artisti si erano già mobilitati per creare immagini di Topolino di cui la Disney probabilmente non sarebbe stata contenta. Su alcuni siti di print-on-demand sono stati messi in vendita magliette, tazze e vari oggetti con Topolino e altri personaggi coperti da copyright creati da Midjourney. L’obiettivo era fare reagire la Disney che, probabilmente, non è rimasta con le mani in mano perché il merchandising sui siti di print-on-demand è poi stato bloccato.

La mossa dell’artista canadese è stata decisamente efficace ed ha messo il dito nella piaga: se l’Intelligenza Artificiale riesce a creare un Topolino così perfetto, significa che è stata istruita con molte immagini di Topolino. Naturalmente, con un personaggio della Disney è facile accorgersene, con i lavori di una artista poco conosciuto no. Di fatto, è molto probabile che le immagini utilizzate includano parecchi contenuti coperti da copyright.

Lo ammette candidamente lo stesso fondatore di Midjourney, David Holz, in una intervista su Forbes “Non c’è veramente un modo di acquisire centinaia di milioni di immagini e sapere da dove provengono”. Inoltre… no, non ha chiesto il consenso degli autori delle opere che ha dato in pasto alle sue macchine e non c’è modo per gli artisti di opporsi.

E qua comincia un’altra serie di problemi. Infatti, oltre a copiare lo stile di un disegnatore o di un fotografo, si copiano anche i soggetti.

Shuterstock si cautela scaricando sui propri clienti la responsabilità di riconoscere che cosa è utilizzabile oppure no. Ecco cosa scrive nella sezione domande frequenti:

Domanda: Sembra che un’immagine generata contenga un marchio, un’attrazione (turistica) o un personaggio pubblico riconoscibile. Posso usarla comunque?
Risposta: No. Non è possibile usare le immagini generate per violare o appropriarsi indebitamente dalla proprietà intellettuale o di altri diritti di terze parti né per generare immagini indesiderate, false, fuorvianti, ingannevoli, pericolose o violente […] Si tratta di una nuova tecnologia dinamica, il che significa che è soggetta a produrre risultati non previsti. Usa il pulsante Feedback presente in ogni immagine per segnalare i risultati che richiedono la nostra attenzione.

Ho fatto altre prove anche io chiedendo di utilizzare lo stile di alcuni fotografi e, in effetti, l’intelligenza artificiale dimostra di conoscerli abbastanza. Il che significa che ha ingurgitato le loro opere. Ma io sono un dilettante in questo campo. In una prossima puntata vedremo che cosa hanno realizzato degli esperti e come hanno fatto. Esamineremo aspetti etici, possibili sviluppi e questioni di copyright. Infine chiederò ad alcuni protagonisti di illuminarci sugli aspetti più pratici.

Hai appena letto l’articolo #1 di una serie di 4 articoli.
L’articolo #2 : Intelligenza Artificiale e fotografia: copyright e sviluppi futuri
L’articolo #3 : Intelligenza Artificiale e fotografia: aspetti pratici
L’articolo #4 : Intelligenza Artificiale e fotografia: fotograferemo ancora?

Enzo Dal Verme
Workshop Ritratto

One Comment

  1. Roberto Besana Reply

    ecco che la cortina di fumosità create ad arte o per non comprese situazioni su queste nuove modalità espressive iniziano a diradarsi

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

error: Alert: Contenuto protetto!
%d blogger hanno fatto clic su Mi Piace per questo: