En el año 2022 publiqué un artículo dedicado a las IAs aplicadas al campo de la creatividad. El 2022, previo a ChatGPT, Dalle, Gemini, entre otros. Para ese entonces la conversación aún se manejaba en planos especulativos, siempre enmarcada por la idea de “si hoy estamos aquí, qué será lo que lograríamos en el futuro”. Para hacer uso de estas tecnologías se necesitaban conocimientos técnicos (manejar bases de datos y Python, por ejemplo) y los resultados que podían alcanzar distaban de ser realistas y “bellos” en el sentido más común y corriente del término.
Todos los puntos anteriores hoy pasaron a ser historia: la tecnología está aquí, es fácil de usar y los resultados son cada vez más convincentes. El norte que ha conducido la evolución de estos modelos ha sido el de mejorar cada vez más el realismo de las imágenes y que la distancia entre el prompt de inicio y el resultado final sea cada vez menor. Para cumplir con el primer objetivo los modelos han sido entrenados en bancos de imágenes cada vez más grandes; para lo segundo han complejizado el proceso de construcción del prompt a través de modelos de lenguaje para que la instrucción sea lo más “efectiva” y entendible para la máquina. En palabras simples, aunque el input sea vago, la máquina lo complejiza para entregar lo que, probablemente teníamos en mente. La máquina “deduce” lo que el usuario desea y aplica la ingeniería de prompt por el usuario.

Este desarrollo sigue el curso de la evolución general de la tecnología, esto es, disminuir la barrera de entrada entre el usuario y la máquina. La interfaz hoy busca ser amigable, íntima, sin fricciones. La caja negra que yace en el corazón de la máquina se complejiza, pero su rostro sigue tan familiar como siempre. En este caso, la abstracción matemática, el poder computacional y el caudal humanamente inconmensurable de datos quedan velados detrás de un simple campo vacío dispuesto para un prompt.
La “democratización” de estas tecnologías se vuelve una realidad gracias a la interfaz. Gracias a ella la ¿creatividad? queda a un sólo clic de distancia, el misterio de la IA se vuelven un campo navegable, la imaginación maquínica se vuelve asible.
¿Pero es esto creatividad?
Cuando escribí ese artículo de 2022, los ingenieros y programadores hacían uso de la metáfora onírica como en Deep Dream o BigSleep. Sin embargo, los resultados eran muy diferentes. Pocas veces realistas y, muchas veces tenebrosos, macabros, abstractos o simplemente raros.
En ellos, las imágenes son producto de colisiones de probabilidades, pero unas sin un verdadero norte. No hay realismo porque la máquina nunca ha conocido la realidad y pareciera como si intentara precisamente alejarse de ella. Frente a estas imágenes la mirada del espectador pierde sus pivotes. Las texturas de estas imágenes revelan el proceso y la existencia efectiva de una “imaginación artificial” dirigida a un norte aún sin nombrar.




Las técnicas que propulsaron a estas máquinas (Redes Adversariales Generativas o GAN por su sigla en inglés) son muy diferentes de las que están a la base de las plataformas actuales (modelos de difusión). Una diferencia que también se ha traducido al nivel de sus interfaces. Como ChatGPT, los actuales generadores de imágenes están diseñados para “cumplir con nuestras expectativas visuales. Esta aceptación está ahí mismo en la matemática, en la forma en cómo estas herramientas destilan millones de imágenes en una formación multidimensional de proximidades de varios estilos y formas. Se inclinan a lo familiar”, como comenta Dan Cohen.
En el modelo de difusión el lenguaje - el prompt - se convierte en una guía por el espacio latente de la memoria maquínica. Un lenguaje que busca la coincidencia. Ese es el objetivo.
Aún así, Soñar es el verbo que decidió ocupar Stability.Ai, la compañía detrás de DreamStudio, cuando uno desea generar una imagen con el modelo. Midjourney prefirió el verbo imaginar. En ambos casos, la probabilidad se equipara al plano del inconsciente y la imaginación humana como comenta Eryk Salvaggio, investigador y artista digital. Pero aquí la “imaginación” está volcada a la re-producción, re-interpretación, re-organización y re-combinación de la base de datos; del pasado y lo ya existente, agrego.
Las máquinas no sueñan ni imaginan el mundo real. La interfaz sólo presenta un juego de espejos sobre el que proyectamos esas ideas; que la verdad del mundo real coincida con el mundo de la máquina es simplemente una correlación estadística.
La memoria y la mente maquínica es otra. Otra cuyo orden es muy diferente al humano.
La máquina alucina, pero ¿de dónde viene esa imagen?
Sus outputs no se condicen con la realidad, escapan de ella. Pero, ¿hacia dónde?
En otras palabras, ¿cuál es la verdad que yace en el corazón de la imaginación de la máquina?
Se escapan, dan tumbos sin dirección por espacios latentes y se conducen más allá de la lógica humana, sin relación a nuestra verdad (la de nuestro cuerpo, nuestro mundo o nuestra ciencia), sin la atadura del cuerpo, sin entendimiento del mundo. Hablamos de posibilidades aún no nombradas por la palabra humana.
Un campo abierto, sin cartografías humanas y planos sólo navegables por la máquina. Otro plano. Una imaginación artificial.
El artista, poeta y programador mexicano Eugenio Tisselli, quien ha experimentado con máquinas que escriben poesía se arriesga a llamar a ese plano el del tecnema.
“Un nuevo polo que extiende las fronteras del lenguaje (…) el cual no está comprometido ni con la precisión ni con la ambigüedad semántica, puesto que carece de intención. En una enunciación producida desde el tecnema, no están presentas las voluntades humanas de precisar ni yuxtaponer. Representa, en cambio, la producción de un mundo artificial a partir de un lenguaje algorítimicamente producido. (…) La voluntad humana, en el tecnema (…) no controla plenamente aquello que generan unas computadores cada vez más emancipadas de nosotros. El tecnema desborda la voluntad humana y, por ello, desborda también la voluntad de significado”.
En la misma línea la ensayista Meghan O’Gieblyn comenta
“Los modelos son como los prisioneros de la caverna de Platón, intentando aproximar conceptos del mundo real del elusivo juego de sombras del lenguaje (…) pero es precisamente esa sombra (en términos jungianos del inconsciente) lo que hace su outputs creativos tan bellamente surreales. El modelo vive en un éter de significados puros, sin los obstáculos de las inhibiciones lógicas que conducen a tanta prosa sin peso. En el mundo de fantasía de su imaginación, el fuego explota bajo el agua, los álamos se vuelven plateados, y las polillas son del color de las llamas”.
¿Es esto imaginación? ¿Es esto un sueño de la máquina de otro mundo?