L’equivoco ‘Intelligenza Artificiale’: la creatività non è imitazione.

Intervista a Lorenzo Ceccotti*, illustratore, fumettista, musicista, docente all’ISIA Roma Design

di Mario Fois con Ruben Palma, ISIA RM

Lorenzo Ceccotti ‘Geist Maschine | Technical Test 03

Pennarelli Nicker Poster Color, Talens Ecoline, Promarker e Copic alcool.

Si parla molto di Intelligenza Artificiale, debole o forte che sia. Pensi che questa denominazione descriva correttamente la nuova frontiera dell’evoluzione tecnologica e che sia possibile una replica artificiale della mente umana?

Penso che l’utilizzo della parola “intelligenza” per definirla abbia una funzione puramente simbolico/metaforica e che ci sia completamente scappata di mano. I software che vengono etichettati sotto l’umbrella term “AI” non hanno poi molto a che spartire con la vera complessità dell’intelligenza umana. Sono certamente software costruiti guardando ad essa come modello, cercano di imitarne alcuni aspetti, ma sarebbe come dire che un manichino per esporre gli abiti sia poi effettivamente comparabile a un essere umano solo per il fatto che è stato sviluppato utilizzando l’essere umano come riferimento. Le AI sono software in grado di rispondere a quesiti le cui risposte non sono già state programmate durante il loro sviluppo e questo le rende, in una certa misura, autonome nel loro ambito specifico di applicazione. Crederle autenticamente intelligenti, però, può portarci a una umanizzazione e semplificazione del loro funzionamento decisamente problematiche.

Le AI non sono infatti in grado di mettere in dubbio i dati da cui partono, non hanno una loro visione del mondo né sono in grado di farsene una a partire da essi: l’unica cosa di cui si compone il mondo di una AI sono solo i dati da cui parte, dati che non si procura autonomamente, ma che sono il frutto di una specifica selezione operata dall’uomo. Le AI, per come le conosciamo ora, sono solo dei sistemi sofisticatissimi per individuare pattern in questa serie di informazioni curate dal creatore del software, i data set. Le AI ci mostrano un punto di vista speciale su queste informazioni come solo una macchina può fare, ma non è in grado di dirci nulla di nuovo che non sia già nei dati. La novità può arrivare da un punto di vista inedito su quello che è già sotto i nostri occhi, ma che potremmo non aver notato a causa dei nostri limiti percettivi. Big Data e AI vanno particolarmente d’accordo per questo motivo, ma non dobbiamo fare l’errore di pensare che guardando questi dati le AI possano darci nuove idee o svelarci qualcosa che non sia già contenuto in essi. Possono solo darci una restituzione statistica e non umana su dati che abbiamo già, ma che possono essere troppo complessi da gestire per quantità e caratteristiche qualitative.

Facade, Andrew Stern & Michael Mateas, 2005; https://www.playablstudios.com/facade

Videogioco in cui il giocatore condiziona l’esito della trama (la crisi di una coppia) tramite input testuali, interagendo con i personaggi ed influenzando le loro conversazioni, i loro responsi, e le loro scelte.

Cos’è realmente l’arte prodotta con l’AI? Il fatto che le opere prodotte con l’AI non siano distinguibili dall’opera dell’uomo che significato può avere?

È davvero difficile dare una risposta generale nello spazio di un’intervista. Se però ci limitiamo a parlare delle AI Text To Image o di Chatbot create delle principali aziende sul mercato – Open AI, Stability AI, Midjourney o Google – qualche spunto di ragionamento è plausibile offrirlo.

Queste aziende vendono ognuna il loro servizio come capace, a partire da un semplice prompt testuale da parte dell’utente, di produrre contenuti originali di qualunque tipo, siano essi testi tecnici, creativi, immagini illustrate o fotografiche e in qualunque stile formale. E a un primo sguardo ai risultati di questi servizi sembrerebbe che sia proprio così. Proviamo però ad affrontare la questione su un piano tecnico. So che può sembrare difficile da immaginare dati gli impressionanti risultati, ma sarebbe più giusto considerare questi software più che degli strumenti di creazione di immagini originali on demand, dei servizi per la produzione di complessissime infografiche statistiche che rappresentano il contenuto di un data set. Nel caso dei servizi attualmente disponibili sul mercato, questi data set sono stati messi assieme e organizzati per gli utenti da terze parti, ovvero dai creatori del software stesso. Quando parliamo di AI per la generazione di immagini, ad esempio, parliamo quindi di servizi di data visualization. Sono software che usano la pertinenza semantica e l’aderenza ai modelli statistici generati dai dati di partenza come criterio di restituzione dei valori su cui vengono interrogate dagli utenti. Proprio per questa natura meta-informativa in cui la visualizzazione stessa diventa il dato da visualizzare, i risultati sono perfettamente mimetici dei dati di partenza tanto da finire spesso in overfitting. Le immagini sono talmente conformi al nostro linguaggio visivo che a una lettura superficiale sono perfettamente comprensibili, mentre resta celata la loro vera natura di visualizzazione di dati statistici: ci illudiamo quindi di ottenere un’immagine che arriva dalla nostra fantasia e che sia formalmente originale e qualitativamente perfetta, ma stiamo “solo” ottenendo una forma di visualizzazione complessa di profili statistici generati da dati pregressi di cui spessissimo (sempre nei casi dei modelli commerciali citati in apertura) non sappiamo nulla.

The Infinity Construct Chapter 2, Dennis Martensson, 2021; https://dennismartensson.bandcamp.com/album/the-infinity-construct-chapter-2

Album musicale generato proceduralmente, della durata di 10 ore. Lo stile, orientato soprattutto alle asimmetrie ritmico-musicali, si presta molto bene a una genesi di questo tipo. Tuttavia, non è presente alcuna novità stilistica.

Come funziona realmente l’AI e quali fonti utilizza per produrre i suoi output?

Le AI vengono informate con una mole enorme di dati attentamente catalogati ed etichettati, i data set. Questi dati vengono quindi processati con un sistema di “deep learning” per creare dei profili statistici che diventano il fondamento di tutto ciò che l’AI è in grado di concepire e manipolare e sono codificati, in una maniera assolutamente non intuitiva per un essere umano, nel “latent space” ovvero uno spazio topologico multidimensionale.  Ecco, per ricollegarmi alla tua prima domanda, l’uso della parola “learning” avviene anche qui in maniera profondamente fuorviante: le macchine non imparano assolutamente nel modo in cui imparano gli uomini. Un bambino può imparare cosa è un gatto vedendone uno soltanto e può farlo attraverso i suoi sensi e la sua percezione del mondo. Una AI ha bisogno di vederne milioni e pur essendo in grado di rispondere a tono con delle immagini convincenti di un gatto continuerebbe comunque a non capire di cosa si tratta. Ne registrerebbe esclusivamente i dati relativi al campo di utilizzo: nel caso di una AI per la generazione di immagini, ad esempio, sarebbe in grado di individuare dei pattern ricorrenti di pixel disposti in forme che può riconoscere come rispondenti all’etichetta “gatto” fornita da un essere umano in fase di tagging del data set. Non avrebbe minimamente senso del contesto, né sarebbe in grado di produrre sensazioni, conclusioni e interpretare autonomamente alcuna realtà.

Esempio ne sia il modo in cui le mani vengono rappresentate dai software AI per la generazione di immagini: le mani compaiono in tutte le immagini dell’uomo presenti nei data set, ma sono sempre rappresentate parzialmente, mentre impugnano qualcosa, di scorcio, mentre stringono le mani di qualcun’altro. Questo rende il processo di analisi statistica pieno di false informazioni che finiscono per creare dei pattern probabilistici assurdi in cui le mani non hanno una struttura stabile. Alle volte hanno 8 dita, altre volte si biforcano e hanno una configurazione impossibile. 

Per lo stesso motivo eventuali dati falsi all’interno dei data set sono considerati allo stesso livello di quelli veri, motivo per cui un software come Chat GPT si esprime in maniera impeccabile, ma scrive spesso assurdità o cose banalmente false. Un’AI sarebbe in grado di generare contenuti con lo stesso grado di efficienza anche a partire da dati completamente inventati, magari in un linguaggio inesistente.

Ciò detto, quando interroghiamo un’AI con un quesito, magari inserendo un prompt per produrre un’immagine con un sistema “Text To Image”, il software cercherà di risolverlo e lo farà nella maniera più conforme possibile ai profili statistici in suo possesso. Il risultato è però tutt’altro che nella forma delle infografiche a cui siamo normalmente abituati, ovvero quelle in grado di darci una visione adattata ad un linguaggio visivo diverso, un’esposizione maggiormente intellegibile e chiara di dati curati e giustapposti. Al contrario, queste AI commerciali operano come una specie di lente statistica in grado di ridurre a una singola immagine miliardi di dati che vengono riportati nel rispetto maggiore possibile della loro forma originaria, del loro “peso” all’interno del set. Non avviene quindi alcuna forma di “traduzione” o valutazione e il cane che abbiamo chiesto di realizzare all’AI con il nostro prompt apparirà esattamente come il cane statisticamente più rilevante nel profilo di riferimento, senza dirci nulla sulla bontà delle informazioni trattate.

In sostanza: sembrano troppo belle per essere veramente capaci di inventare qualsiasi immagine o testo dal nulla, ma il punto è proprio che non ne sono capaci e che per capirle fino in fondo è indispensabile partire dall’analisi delle fonti che costituiscono letteralmente il loro mondo.

Stable Diffusion with brain, Yu Takaji & Shinji Nishimoto presso Osaka University, 2023;

https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2.full.pdf

Implementazione dell’AI Stable Diffusion negli scan MRI, per una ricostruzione e un denoise delle esperienze/impressioni visive del cervello umano. Esiste il rischio di una “banalizzazione” del sogno?

Pensi possa essere utile valorizzare il ‘processo’ che porta all’opera e non solo il risultato finale?

Ti rispondo intanto dal punto di vista, più comune, del fruitore. Poi, in una domanda più sotto colgo l’occasione di risponderti dal punto di vista del creativo.

Da fruitore, il processo è sempre stato un ambito di ricerca fondamentale, è il cuore dell’apprendimento, credo che acquisterà ancora più valore in un contesto in cui saremo circondati da servizi in grado di fornirci risultati on demand senza che vi sia alcun processo intelligibile. Questo però non deve distrarci dal fatto che l’artista, di solito, fa di tutto per cancellare le tracce del suo processo, non perché sia un egoista, ma perché, come un prestigiatore, è alla ricerca di un effetto illusorio che non può funzionare a carte completamente scoperte. Il suo scopo è l’azzeramento del processo, di modo tale che sia solo l’opera a parlare. Inoltre un artista che si illuda di poter spiegare la propria opera illustrandone il processo può solo provare a spiegare il suo percorso dal suo punto di vista, ma si sa che le opere hanno una loro autonomia una volta pubblicate e si interfacciano con la vita di tutti gli altri. Restano significanti abbandonati a loro stessi e non possiamo sempre contare su un artista che stia lì a spiegarci le sue intenzioni. A quel punto contano solo i risultati nell’interazione con il pubblico. Esistono certamente anche artisti che fanno del processo la loro materia prima artistica, penso ad esempio a chi si occupa di arte performativa collaborativa, procedurale o generativa, ma non possiamo certo rifugiarci dentro a questa specifiche tipologie di espressioni solo perché pensiamo che le altre siano minacciate dalle AI. Le AI TTI sono già ora in grado di produrre le fasi di lavorazione di una data immagine, falsificando anche foto dal tavolo di disegno o da schermate di software di imaging. Producendo un falso processo a posteriori, quindi. Concludendo, credo che il processo abbia sicuramente un enorme valore culturale e di formazione, ma che non possa essere considerato un rifugio dall’incombente necessità di una crescita culturale collettiva che ci permetta di comprendere fino in fondo questa nuova tecnologia, la sua vera natura oltre il velo mimetico dietro il quale si nasconde e tutte le implicazioni che comportano a livello sociale e umano.

Personal room fragrance, Moooi & EveryHuman, 2023; https://moooi.everyhuman.com/nl/en/products

Quest’azienda fornisce degli aromi d’ambiente personalizzati, generati tramite intelligenza artificiale in base a una profilazione effettuata dall’utente stesso.

Come formatore come pensi vada affrontata la possibilità da parte degli studenti di utilizzare tecnologie basate sull’AI, in grado di ‘produrre’ autonomamente contenuti testuali e immagini?

Il principio tecnologico dietro alle AI sarà senza dubbio una enorme risorsa per il futuro dell’umanità e insegnando in una scuola di progettazione credo sia mio dovere rendere gli studenti consapevoli della vera natura e delle caratteristiche peculiari di questo tipo di software. I mezzi e le tecnologie vanno studiati per quello che sono e per quello che offrono, non sulla base di false promesse o mistificazioni da parte degli uffici marketing che cercano di venderci i loro prodotti o servizi. La promessa di poter produrre contenuti creativi senza che ci sia bisogno dell’intervento umano, è la promessa di una soluzione a un problema che non esiste. Tentare di convincerci che il processo creativo sia un problema da cui dobbiamo essere sollevati, è certamente un modo molto furbo per venderci l’idea che per essere creativi l’acquisto dei loro servizi sia indispensabile. Comprendere a fondo questi software significa soprattutto essere lucidi e scevri dalla fascinazione superficiale del crederli davvero intelligenti e ci permette soprattutto di essere responsabili e consapevoli davanti ai dati che trattano per darci i loro risultati.

Freyr/Freya 1, Giacomo Cerioni, 2023;

Come agire di fronte alle censure etico-estetiche degli attuali motori di text to image? Tramite una gestione traversa e analogica del prompt su Stable Diffusion, l’artista è riuscito a rappresentare sui soggetti dell’opera dei genitali, i quali, se fossero stati richiesti direttamente, sarebbero stati censurati.

In prospettiva futura quali aspetti formativi pensi vadano valorizzati per il design ma anche per le altre discipline artistiche e progettuali?

Torno a parlarti del processo, dal punto di vista del creativo, stavolta.

È di vitale importanza infondere la consapevolezza del valore che ha il processo creativo, di quanto sia importante non aggirarlo delegandolo ad un servizio automatico. Bisogna invitare i giovani a scoprire la ricchezza che si nasconde nel percorso che impone la creatività, i doni che è in grado di offrirci semplicemente affrontandola con sensibilità e cultura. Per non parlare delle collaborazioni con i propri colleghi o con artisti e creativi specializzati in altre discipline dalla nostra. Trasformare i propri sogni nel futuro non può ridursi a comprare solipsisticamente analisi statistiche automatizzate di dati preconfezionati da sconosciuti e provenienti da un passato che conosciamo già illudendoci di creare qualcosa di nuovo

Pensi che l’avvento dell’AI ci ponga di fronte a problemi etici generali mentre altri specifici, come quello del diritto d’autore, rendono necessaria una presa di coscienza e opportuni interventi legislativi?

I problemi etici sono innumerevoli. Quando si utilizza uno di questi servizi per la creazione di contenuti “creativi” e che quindi operano su data set precostituiti, non possiamo sapere quali siano i bias endemici ai dati e quelli di chi ha etichettato i dati. Oggi le AI ci dicono qualcosa su informazioni che fanno capo ad un mondo occidentale, bianco e legato a prodotti e immagini che hanno avuto la forza di propagarsi pervasivamente e diventare un peso statistico rilevante, ad esempio tutto quello per cui è stato speso del denaro in comunicazione, che è stato mezzo di propaganda. Questo significa, ad esempio, che i modelli di bellezza sono strettamente legati ai target industriali e politici, il che rende il linguaggio di questi software mostruosamente allineato a quello che è stato l’immaginario dominante, rivolto a specifiche classi sociali, di specifici paesi. Al momento, i dati utilizzati nel deep learning da questi sistemi devono essere per forza molti. Differentemente le AI non sarebbero state in grado di operare in maniera così rilevante sul mercato creativo, di offrire cioè quella versatilità e qualità formale che sta lasciando tutti a bocca aperta. Se ad esempio un’AI fosse informata trattando i dati del lavoro di un solo artista, sarebbe in grado di produrre esclusivamente materiale conforme alla forma di quegli specifici lavori. Sarebbe in grado di restituirci solo uno stile e lo farebbe su un numero limitatissimo di soggetti, risultando utile alla soluzione di un ristrettissimo quantitativo di quesiti degli utenti, riducendo cioè la propria forza sul mercato. Per questo motivo le aziende che offrono servizi per la produzione di immagini generative basate su deep learning hanno avuto bisogno di trattare miliardi di immagini in ogni stile e forma e raffiguranti ogni tipo di soggetto. Altrimenti verrebbe meno la loro “unique selling proposition”, ovvero la capacità di poter sostituire qualsiasi tipo di creativo per una cifra irrisoria. Analizzando questa situazione appare chiaro che pur di offrire l’impossibile queste aziende ci hanno messi davanti alla situazione inedita di uno sfruttamento massivo a scopo di lucro di dati sensibili coperti da privacy senza alcun consenso informato e di opere coperte da copyright senza alcuna licenza d’uso. La pratica dello “scraping” dei dati da internet, ammessa candidamente in svariate interviste da tutti i principali attori sul mercato, è chiaramente in violazione di molteplici accordi, dal GDPR ai fondamenti del diritto d’autore (messa a disposizione illecita, trasformazione, imitazione, derivatività, e rispetto dei principi morali dei legittimi proprietari). Si tratta di una pratica predatoria e scorretta che ritorce i dati contro i loro legittimi proprietari offrendo sul loro stesso mercato plagi e imitazioni delle loro opere rese possibili proprio dal loro lavoro. È una modalità di produzione di immagini che pone degli ovvi rischi alla sicurezza individuale offrendo alla mercé di chiunque le proprie immagini per la produzione di deepfake infinitamente più facili da ottenere e infinitamente più difficili da contestare di un semplice fotomontaggio: questo avviene sia per una infinità di motivi tecnici che hanno a che fare con la natura tecnologica delle immagini generate con le tecniche di diffusione e che non penso possano essere discussi qui che per motivi puramente pratici: ad esempio, per come operano questi software non è dato neanche sapere se il volto di una persona in una foto generata esista davvero o meno, se sia o meno un deep fake capitato per un caso di overfitting.

Cos’è esattamente EGAIR?

EGAIR è l’associazione internazionale europea per la regolamentazione delle intelligenze artificiali. I membri dell’associazione sono autori di ogni genere: ci sono disegnatori, fumettisti, concept artists, designers, scrittori di fiction, attori, game designers, giornalisti, programmatori, musicisti. Ne fanno parte anche associazioni di categoria internazionali, sindacati, festival, scuole e aziende che operano nell’ambito creativo come case di produzione o editori.

EGAIR si muove in collaborazione con la CAA (Concept Art Association of America) che sta affrontando la nostra stessa battaglia su una piattaforma legislativa completamente diversa da quella Europea, quella Americana. Proprio per questo EGAIR si concentra sulla situazione Europea, per operare in maniera conforme ai principi specifici dell’Unione. In Europa esiste infatti un documento in lavorazione, l’AI Act, che si occupa di definire le regole con cui le Intelligenze artificiali possono operare. Purtroppo abbiamo constatato che a parte alcune specifiche applicazioni ritenute “high risk”, ad esempio quelle militari, non c’è traccia di argomenti che riguardino il lavoro creativo e la comunicazione.

A nostro avviso questa è una gravissima mancanza che rischia oltretutto di porci davanti a serissimi problemi sociali e proprio di sicurezza.

EGAIR muove la sua attività a partire da un manifesto di 5 semplici punti in cui viene chiesto che qualunque dato trattato per informare una intelligenza artificiale venga consapevolmente liberato dal legittimo proprietario (https://www.egair.eu/#manifesto). Che le opere coperte da diritto d’autore vengano usate per informare sistemi di intelligenza artificiale solo con contratti di licenza specifici, che possano prevedere una durata e modalità di sfruttamento limitati (per supporto, applicazione, paese etc.), esattamente come avviene per tutte le altre forme di sfruttamento commerciale. Che si delineino quindi tre scenari molto semplici in cui i dati possono essere ceduti sotto compenso e con precisi accordi commerciali, ceduti a titolo gratuito o non ceduti affatto. Ora come ora queste aziende si muovono per silenzio assenso e offrono al limite l’opzione di essere rimossi dai data set, l’”opt out”, una proposta chiaramente irricevibile davanti a un “opt in” unilaterale che non è mai stato concordato con nessuno.

Siamo fermamente convinti che, similmente a quello che è successo per una tecnologia regolamentata come la stampa, il nostro manifesto ponga delle richieste che, se ascoltate nelle sedi opportune, non saranno un freno per lo sviluppo, ma ci porteranno anzi in una direzione di prosperità e di integrazione solida con queste nuove tecnologie, creando autentici e stabili presupposti per una nuova opportunità di crescita per l’umanità. È un approccio opaco e problematico al trattamento dei dati ad essere un impedimento al progresso come andrebbe inteso, ovvero un mezzo per migliorare la qualità della nostra vita e non una strada spianata verso monopoli anti umanistici.

Oggi è possibile firmare il manifesto sul nostro sito e donare per supportare la nostra operazione che coinvolge esperti di lobbying e comunicazione con le istituzioni che ci aiuteranno a coordinare i lavori in tutti i singoli paesi membri dell’Unione e che gestiranno i tavoli di discussione in sede Europea, esperti di comunicazione e uno studio legale specializzato sulla tutela del diritto d’autore.

*Lorenzo Ceccotti

VIDEO ANIMATION

Lorenzo Ceccotti, noto anche con lo pseudonimo di LRNZ, è un fumettista e illustratore italiano.

Si forma alla Scuola Romana di Fumetti e alla Scuola Internazionale di Comics, frequentando contemporaneamente l’Istituto superiore per le industrie artistiche dove studia Industrial Design.

Opera in molti settori dell’arte visuale: videogame, fumetti, illustrazione, animazione, graphic design e altro ancora. È uno dei fondatori del collettivo Superamici, con i quali realizza la rivista “Hobby Comics”.

Creatore di loghi, industrial designer, illustratore di copertine per Einaudi, produttore, disegnatore e animatore del cortometraggio “The Dark Side of the Sun” di Carlo Shalom Hintermann.

Ha illustrato le copertine per le miniserie “Long Wei” (Aurea Editoriale), Nick Banana (Star Comics) per il Dylan Dog Color Fest n 13 (Sergio Bonelli Editore). È autore di “Golem” (Bao Publishing) ed è di prossima pubblicazione “Astrogamma”, sempre per Bao Publishing. Vincitore del Premio Boscarato per il Miglior Disegnatore Italiano, assegnato al Treviso Comic Book Festival 2015.

All’attività di fumettista affianca dal 2007 anche quella di docenza.