Número 123 (juliol 2022)

Imatges i intel·ligència artificial: som-hi de nou

Gemma San Cornelio

Fa uns quants dies, van aparèixer diverses notícies relacionades amb la creació d’imatges amb intel·ligència artificial. Particularment, es tracta del programari DALL-E i de la seva versió lleugera DALL-E mini (que acaba de reconvertir-se en Craiyon). Ambdós són capaços de generar imatges a partir d’un text. Curiosament, coincidien amb alguns esdeveniments sobre art digital, com el festival i congrés ISEA, realitzat recentment a la ciutat de Barcelona.

Potser ens trobem davant l’enèsim experiment per entrenar sistemes algorítmics. En aquesta ocasió, a partir d’un text, es generen imatges creades mitjançant la fusió del que el sistema troba a la xarxa sota aquelles etiquetes o el text que acompanya les imatges. Com també va succeir anteriorment amb altres sistemes (per exemple, l’algoritme que proporcionava una versió envellida de cares humanes), son les xarxes socials les que viralitzen aquest tipus de continguts, ja que molts resultats són d’una estranyesa curiosa o graciosa, i són potencialment convertibles en mems.

 

Alguns exemples dels quals es va fer ressò el diari The Guardian són la imatge de Trump barrejada amb el nadó de la portada del disc Nevermind de Nirvana (us deixem amb la intriga que la cerqueu) o aquesta de Darth Vader passant el tallador de gespa:

 

 img-dins_article-sancornelio123a

 

 

 

 

 

 

 

Darth Vader passant el tallador de gespa

Font: Twitter

 

Sens dubte, aquests dibuixos que provenen del DALL-E mini donen joc a la imaginació. D’una banda, alguns semblen intents maldestres de dibuix o de pintura (com aquella imatge de l’Ecce Homo popularitzada anys enrere) i d’altres recorden una mica les pintures de Francis Bacon, com aquest gos configurat amb diferents posicions que apareix amb la cerca «Dog in the park» (realitzada amb la versió online de l’aplicació).

 

 img-dins_article-sancornelio123bb

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Imatge generada amb DALL-E mini

Font: Hugging Face

 

Realment, la diferència en la qualitat gràfica entre totes dues versions és notable, si tenim en compte algunes creacions com la imatge següent, generada amb el DALL-E (que a diferència de l’anterior no està en obert, sinó que requereix llicència), i que s’acostaria més a l’estètica d’un fotomuntatge surrealista o fantàstic.

 

 img-dins_article-sancornelio123c

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Imatge generada amb la versió de pagament de DALL-E

Font: Twitter

 

Qüestions ètiques i reflexions sobre imatges creades amb intel·ligència artificial

 

Aquest nivell de resolució de la imatge ens fa pensar en qüestions ètiques relacionades amb l’ús d’aquestes, com els deep-fakes que se’n puguin derivar, especialment quan es tracta d’imatges de rostres humans. En aquest sentit, ja es comença a alertar i a posar mesures per a altres sistemes que poden tenir resultats molts semblants.

 

Un altre element crític seria el potencial impacte que puguin tenir aquests programes per a les professions de tipus creatiu . Com sol ser habitual, alguns veuen perillar la feina dels dissenyadors gràfics o de la fotografia que realitzin aquest tipus d’imatges. Si un programa et retorna el que li demanes, i dona vida a un brífing d’unes paraules o una frase, per què caldria demanar-ho a un professional?

 

No obstant això, altres hi veuen la possibilitat d’expandir la creativitat fins a altres nivells, ja que si bé un programa d’aquestes característiques pot oferir una primera versió d’un encàrrec a partir d’una cerca literal d’un text, la feina d’un artista el pot portar cap a altres direccions, és a dir, que aquesta creativitat algorítmica pot portar a més creativitat, informada i guiada per una intel·ligència humana.

 

Ens trobem sens dubte davant reptes tecnològics importants, però la història de tots els reptes viscuts anteriorment ens ha de fer aprendre i valorar el que la creativitat humana pot portar més enllà de l’anècdota o del solucionisme tecnològic, i la universitat hi té un gran paper, en la formació humanística i creativa. Ho revisarem d’aquí a un temps.

 

Per saber-ne més:

TAYLOR, Josh (2022, Juny). «From Trump Nevermind babies to deep fakes: DALL-E and the ethics of AI art». The Guardian [en línia]. Disponible a: https://www.theguardian.com/technology/2022/jun/19/from-trump-nevermind-babies-to-deep-fakes-dall-e-and-the-ethics-of-ai-art?CMP=share_btn_tw

 

Citació recomanada

SAN CORNELIO, Gemma. Imatges i intel·ligència artificial: som-hi de nou. COMeIN [en línia], juliol 2022, no. 123. ISSN: 1696-3296. DOI: https://doi.org/10.7238/c.n123.2248

creativitat;  fotografia;  mitjans socials;  cultura digital;  disseny audiovisual;