Artículo de Investigación
Cómo los tecnólogos “responden” a lo que suele ser llamado “imagen”. UNA RESPUESTA ARQUEOLÓGICA MEDIAL AL “CUESTIONAMIENTO SOBRE LA ONTOLOGÍA CAMBIANTE DE LA IMAGEN”1 Wolfgang Ernst2
Recepción: 21 Junio 2023
Aprobación: 05 Septiembre 2023
“Tradicionalmente pensamos en las imágenes como [...] fenómenos delimitados que de una u otra manera aparecen en la mente humana y el aparato de percepción” [Cuestionario].3 La elección de palabras en el Cuestionario ya es indicativa. Cuando se observa de cerca la fisiología óptica y la sensación cognitiva de imágenes, desde el ojo “analógico” tipo «cámara oscura» hasta el cerebro casi “digital” que procesa señales (Von Helmholtz, 1867), el procesamiento de imágenes dentro del ser humano resulta ser, de hecho, una función de un “aparato”. El concepto no metafórico de Sigmund Freud (1900) del “aparato” psíquico en el capítulo VII, “Interpretación de los sueños”, en Die Traumdeutung, compara explícitamente las etapas preliminares de la imagen con el microscopio o la fotografía (Baudry, 1975).
El enfoque mecanicista reapareció en la investigación protocibernética en la simulación de circuitos eléctricos de percepción de imágenes neuronales (McCulloch y Pitts, 1947). La “mente y el aparato de percepción” humana [Cuestionario] se convirtieron literalmente en una maquinaria no humana en el «perceptrón computacional» de Rosenblatt (1958), liberando a la “imagen” de su antropocentrismo fisiológico.
Hasta ahora, la visión por computadora ha permanecido diferente de la cognición de imágenes humanas. Pero las imágenes técnicas como salidas de las Redes Neuronales Artificiales comienzan a desafiar y emular el potencial imaginativo humano toda vez que no son entrenadas por etiquetado humano, sino también —de manera más compleja— por máquinas rivales que se alimentan con grandes volúmenes de datos derivados de “redes sociales”. Al igual que Gottfried Ephraim Lessing, en su tratado de 1766 Laocoonte, casi había identificado las propiedades estéticas de las artes visuales como percepción paralela —aisthesis, en el sentido aristotélico— de unidades coexistentes en el espacio, hoy en día, no es casualidad que el deep machine learning tenga lugar en unidades de procesamiento gráfico paralelo (GPU) que originalmente se desarrollaron para el procesamiento de imágenes en computadoras. La inteligencia artificial no simplemente imita la percepción de imágenes humanas —incluso si las pinturas producidas por IA al estilo de Van Gogh son trucos publicitarios, según el discurso contemporáneo—, sino que desafía de manera más profunda la visión narcisista de que los humanos son los únicos seres capaces de desarrollar un sentido semántico de las imágenes. Las salidas de las Redes Neuronales Artificiales —como los Mapas Auto-organizados—, que son predominantemente imágenes, recuerdan al ser humano la tecnicidad de su propia percepción de imágenes.
La actual “intensificación de lo que podríamos llamar la interconexión de la imagen” [Cuestionario], desde un punto de vista de la arqueología medial, es una externalización de la esencia inherentemente “textil” de la producción técnica de imágenes (Schneider, 2007). La imagen técnica dentro de las arqueologías mediales ya ha sido conectada en red desde adentro, tanto material como lógicamente: como un tejido, que se volvió tecnológico en el telar programable de Jacquard. El tema general del Festival de Arte Electrónico Holandés (DEAF) en Rotterdam en febrero-marzo de 2003, Data Knitting4 recordó esta primera producción proto-digital de “imagen” en Francia cerca de 1800, que poco después proporcionó el modelo para el procesamiento de datos en el diseño de la primera computadora programable de Charles Babbage.
na imagen matemática y computacionalmente definida es una configuración arbitraria e improbable físicamente —por lo tanto, neguentrópica— de elementos pictóricos. El píxel, como el elemento pictórico «digital» más pequeño concebible, tiene sentido de maneraicónica cuando aparece dentro de un grupo. La digitalización de imágenes es tecnologocéntrica. “Quiero tomar el control de cada píxel”, expresó una vez el artista de medios Andreas Menn en su película experimental sobre imágenes digitales titulada Workout (Academy of Media Arts Cologne, 1999). Desde aquí surgen nuevas opciones para encontrar «con/en» motores de búsqueda visual con un objetivo preciso de cada píxel en una imagen. Tal análisis puede ser puesto en marcha por un algoritmo de clasificación, que paso a paso deconstruye el significado iconológico de la imagen reorganizando los píxeles de acuerdo con los valores de similitud de color. El sitio web del proyecto Searching Images expresó esto mediante una duradera animación flash.5
No es la alta resolución de una imagen lo crucial para su reproducción —o más bien: transformación— digital, sino su direccionabilidad hacía cada unidad de píxel discreto. Este es un enfoque no social, ya que ignora las implicaciones discursivas, por ejemplo, de la intención del pintor. Con la digitalización, lo que hasta ahora pertenecía a las Humanidades se vuelve algorítmicamente “inhumano”. El reconocimiento electrónico de caras identifica esquemas, no individuos. Una vez traducida en números computables, la memoria del arte del pasado cultural invita al análisis algorítmico, como el reconocimiento de patrones —también conocido como “estilo”—, en cantidades anteriormente inalcanzables para un solo erudito.
n su escalada desde la telecomunicación pasiva “analógica” a la inteligencia algorítmica “digital” —en todos los sentidos—, la era de la transmisión, almacenamiento y procesamiento de señales electrónicas ha dado lugar a “una proliferación de imágenes de máquinas que operan de manera independiente a la percepción y cognición humana” [Cuestionario]. Lo que la estética cultural solía llamar “imagen”, se transforma radicalmente en una función de imagen tecno-matemática. Tales imágenes técnicamente operativas —en lugar de corporalmente performáticas— se han convertido en “imágenes sin un objetivo social” [Cuestionario]. En cambio, se relacionan con la “mirada fría de la arqueología medial”.
La mirada fría del ojo-cámara de los medios televisivos se relaciona con la estética arqueológica medial. La “distancia patética” de Friedrich Nietzsche en un análisis filosófico insiste en la exterioridad del análisis, en contraposición a la empatía hermenéutica. Incluso de forma más rigurosa, esto se corresponde con la estética del desapego de Ernst Jünger (1989), como un modo de percepción creado por la tecnología óptica. El software de búsqueda de imágenes de la empresa Cobion en Kassel, Alemania, por ejemplo, solía rastrear la web en busca de imágenes pornográficas de abuso infantil; esta tarea podría haber sido dolorosa para los humanos, pero no para la máquina (Kegel, 2001). La mirada arqueológica medial es «fría», en el sentido de McLuhan, al diferenciar entre los medios «calientes» y «fríos», siendo los últimos los que invitan a un receptor humano a participar activamente cuando las señales visuales puestas se transmiten en relación(es). Cuando los propios medios se convierten en arqueólogos activos de datos, la mirada fría de la máquina deja de ser una visión empática y se convierte en un elemento óptico en sistemas de retroalimentación cibernética.
¿Tiene sentido para la teoría de los medios aplicar metonímicamente la categoría de la mirada humana a la visión de las máquinas? Dziga Vertov, en su película The Man with the Camera, convierte al ojo de la cámara (el KinoGlaz)6 en un agente de visión. En la película de Alfred Hitchcock, The Birds, en un momento dado, la cámara cambia a la perspectiva de los pájaros desde arriba, lo que hace que toda la escena parezca completamente diferente. Pero la perspectiva general en esta película es, técnicamente, la del “ojo” de la cámara, que sigue siendo una analogía de la percepción panóptica humana. Sin embargo, en los sistemas tecno-matemáticos, la noción misma de «ver» se vuelve metafórica. En su procesamiento de las entradas ópticas como datos, las señales se abstraen radicalmente. En tales tecnologías, “comando”, “control”, “comunicaciones” e “inteligencia” convergen. Los Misiles de Crucero son guiados mediante «mapeos» visuales pregrabados coordinados con lo que se percibe en realidad, como en el GPS para la navegación, donde se comunican datos topológicos en lugar de imágenes. Tales imágenes operativas difícilmente son “imágenes”.
La “visión” arqueológica medial, de hecho, corresponde con la estética de la lectura de imágenes técnicas. El propio haz de escaneo es en sí mismo un verdadero arqueólogo aquí, como en el caso de la detección de rastros submarinos de monumentos antiguos. La búsqueda de los restos del transatlántico Titanic ha sido una verdadera instanciación de tal arqueología submarina. Mientras que la mirada de la cámara es capaz de buscar evidencia pura —en el sentido de la detección remota de datos—, el ojo humano confunde inmediatamente las impresiones visuales con la imaginación cuando se trata de “representar” tales reliquias (Sobchack, 2011). “Fuera de la oscuridad, como una aparición fantasmal, aparece la proa de un barco [...] tal y como se posó hace ochenta y cuatro años”, se lee en el guion de Titanic, de James Cameron; quien recuerda su experiencia en la búsqueda submarina: “Inicialmente [...] yo era como el astronauta que experimentaba la luna como una serie de listas de verificación y protocolos de misión […] en cierto punto abandoné ‘el plan’ y permití que la parte emocional de mi mente se involucrara con el barco. Eso hizo toda la diferencia en el mundo” (Cameron y Marsh, 1997). La brecha entre el conocimiento visual y la imaginación histórica busca reemplazar la evidencia arqueológica por la reanimación historicista, la navegación de datos— por la empatía hermenéutica, al igual que el eco del sonar en la arqueología submarina se convierte en «resonancia» cultural en los humanos. Pero no confundamos los datos con la visión imaginativa. A veces, el conocimiento iconológico, cultural o histórico de la contextualización de la imagen puede impedir una comprensión operativa.
Incluso si la impresión visual humana sigue siendo el propósito esencial de la mayoría de las tecnologías de imagen, los eventos reales de transducción de señales ópticas y el procesamiento de señales digitales nos recuerda una comprensión tecnológica interna completamente diferente de lo que es —o hace— una “imagen”, sus configuraciones específicas revelan un tipo diferente de fenomenología «medial».
La arqueología de medios observa las imágenes digitales no iconológicamente, sino tecnológicamente. La “mirada arqueológica fría” reconoce el formato de la imagen digital como funciones de borde definidas por la manipulación de datos, una vez que han sido muestreados en el régimen digital mediante la conversión analógica a digital (Loriferne, 1982), o cuando nacen algorítmicamente. De esta manera las imágenes se vuelven calculables en lugar de narrables.
La arqueología de medios aborda los aspectos técnicos de la imagen, es decir, “como medio”. Pero incluso el término “imagen técnica” es en realidad engañoso, ya que la tecnología no conoce imágenes en el sentido humano. En su lugar, la imagen debería definirse matemáticamente como “una función real de dos variables reales” (Rosenfeld, 1969). ¿Por lo tanto, tiene sentido la “imagen” —en su doble significado— para la fenomenología humana, o hay algo así como un “otro” en el fenómeno de la imagen desde el punto de vista técnico? (Bogost, 2012). “El término ‘imagen’ sugiere un objeto plano cuya apariencia varía de punto a punto” (Rosenfeld, 1969). Esta variación ha sido una función perceptual de la visión humana hasta ahora, pero actualmente regresa desde dentro de la tecnología, donde una distribución espacial se vuelve radicalmente temporalizada (Barker, 2012). Con la televisión electrónica ha sido el ojo humano el que integra el «punto volador» que emana del tubo de rayos catódicos en una “imagen”, mientras que “una máquina puede capturar la misma imagen, sin conciencia o experiencia de la forma visual” (Farocki, 1992). ¿Existe tecnológicamente algo así como la “imagen implícita”?
Mientras que las imágenes creadas por humanos, ligadas al cuerpo como técnicas culturales, no pueden ser “liberadas” de la semántica cultural y la iconología histórica —arte—,7 las acciones de imágenes genuinamente codificadas técnicamente “ya no representan un objeto”, “sino que son parte de una operación” [Cuestionario]. Este tipo de imágenes ya no son principalmente iconología cultural, sino una iconología verdaderamente técnica que viene por sí misma como un log-icon,8 en el sentido de la iconicidad diagramática de Charles S. Peirce.
Los tecnólogos, mientras oscilan entre lo real electrofísico —materia— y lo simbólico computacional —programación—, no conocen ningún «imaginario» en el sentido psicoanalítico. Las imágenes en los medios computacionales —también conocidos como «nuevos»— están mediando cada vez más las relaciones “sociales”, reemplazando la comunicación convencional cara a cara en presencia real por la telecomunicación «vía» interfaces. Pero ya no hay nada “social” en los llamados “medios sociales”, sólo comunicación en términos de ingeniería (Luhmann, 1981). “Gran parte de la interacción social se ha referido a las interfaces de diferentes tecnologías de comunicación en tiempo real, hasta el punto en que el campo social está constituido en gran parte por la producción y distribución de imágenes” [Cuestionario]. A primera vista, parece como si la crisis pandémica hubiera acelerado el impacto de la circulación global de imágenes al acelerar los formatos de videoconferencia digital como Zoom. Pero el zoom se ha convertido en una metáfora opto-técnica en sí misma que se queda atrás en la transformación decisiva de los medios visuales indexicales contra la total datafic(a)ción.10
Mientras que la lente de una cámara material permite un zoom óptico verdadero, el zoom digital “ajusta la imagen en la propia cámara [...], que es simplemente algo de procesamiento de imagen en la cámara” que amplía el área de la imagen en el centro del cuadro y recorta los bordes exteriores.11 La cámara en sí misma no tiene sentido de la “imagen”, sino que conoce las funciones tecno-matemáticas de la imagen. La “imagen” digital tecnologiza la imagen visual. ¿No debería lo “visual” aquí ponerse entre comillas, o más bien la “imagen” en sí misma?
En el análisis arqueológico medial, el antiguo “campo social” se convierte en una matriz de datos. La compañía británica Vivacity Labs ha instalado mil cámaras de vigilancia en todo el país para el registro permanente de peatones, bicicletas y automóviles. Una vez transcritas en datos, estas señales ópticas pueden ser interpretadas por un algoritmo de inteligencia artificial para predecir y anticipar, por ejemplo, un atasco de tráfico (Klatt, 2020). De repente, la pandemia de Coronavirus alteró la función de este dispositivo panóptico de vigilancia de datos en favor del control automático del “distanciamiento social”, modificando el algoritmo para medir la distancia prescrita entre los transeúntes. Así, la «vivacidad» por sí misma se convierte en una función técnica, en una analogía directa con las aplicaciones de advertencia —o rastreo— de Coronavirus en los smartphones basada en distancia métrica de bluetooth que ya no captura imágenes de humanos, sino simplemente los datos de sus dispositivos de comunicación móvil. Irónicamente, son ahora las mascarillas faciales —destinadas a evitar la propagación viral— las que impiden el reconocimiento facial automatizado que ha sido la preocupación de la protección de la privacidad hasta ahora. Son datos anónimos que se generan de esta manera. “Discurso” se convierte en tráfico de datos.
Una verdadera ontología tecno-lógica de la imagen tiene lugar en los gráficos por computadora. El análisis más radical de la arqueología medial es llevado a cabo por la máquina misma, como un enfoque “que desafía un registro antropomórfico” [Cuestionario]. La mayoría de las imágenes en los medios sociales son todavía “derivaciones indexicálicas” [Cuestionario] y, por lo tanto, se refieren al mundo humano. Esta imagen digital no es más que una mera “extensión del hombre” en el sentido de McLuhan. La imagen digital llega a su propio ser y comienza a desarrollar su propia ontología cuando “nace” algorítmicamente.
“La llegada de las imágenes operativas y la visión de las máquinas” cambia la “ontología” de la imagen [Cuestionario]. En la ontología orientada a objetos,12 la imagen tiene una existencia no humana. Pero la pregunta de cómo “nosotros, como —artistas, teóricos, críticos, analistas, etc.— concebimos estos cambios en la ontología de la imagen” [Cuestionario] todavía limita el debate a la esfera cultural o intelectual. El “nosotros” antropocéntrico afirma el enfoque en la estética humana. La “imagen” sigue ligada a la cultura mientras el análisis de tales desarrollos se limita a la percepción «humana». Pero el diagnóstico de Walter Benjamin (1969), sobre los “cambios profundos en la percepción” provocados por la fotografía y el cine asumen el punto de vista del objetivo de la cámara misma.
Entonces, ¿cómo se deben analizar las obras de arte en la era de la imagen no humana? “¿Pueden aún ser comprendidas dentro de los campos establecidos de la cultura visual” [Cuestionario], o por medio de la iconología histórica del arte (Erwin Panofsky)? El análisis de la “imagen técnica” (Flusser, 2011), requiere más bien un enfoque científico-mediático (Ernst y Heidenreich, 1999).
El espacio de la imagen contemporánea ya no está definido por la semántica cultural, el discurso visual ni las técnicas culturales relacionadas con el cuerpo, como la pintura, sino por “las condiciones mismas de la obra de arte” [Cuestionario] y su “archivo”, en la definición de Foucault (1969), que cambian a medida que se basan en tecnologías no discursivas. “la palabra ‘la arché’ en francés [...] significa la forma en que los eventos discursivos han sido registrados y pueden ser extraídos del archivo” (Foucault y Wade, 1976). Desde un punto de vista computacional, esto no es una metáfora archivística, sino que lo que hace el microprocesador en el procesamiento visual es asignar a la imagen sus ubicaciones de almacenamiento y proporcionarles direcciones. Una arqueología radical de los medios técnicos estudia estas condiciones no-discursivas de una formación visual emergente.
La imagen archivo, como institución de memoria visual, ha tenido una agencia bastante pasiva hasta ahora, dependiendo de los seres humanos para llevar a cabo los significados iconológicos de los registros visuales. Pero con su actual digitalización y algoritmización, que es más importante, altera los principios “condicionantes” de la imagen, la mayoría de las colecciones de imágenes convencionales se vuelven operativas por sí mismas, asumiendo una agencia activa.
Incluso si la tentación todavía está presente “de replicar modelos ya conocidos como una base de datos con descriptores de campo estándar y una interfaz para la consulta pública que imita el álbum de fotos”,13 el enfoque alternativo de la arqueología medial toma el escaneo digital tal como es. La digitalización de una imagen no es simplemente una conversión práctica de un formato a otro, sino que “cambia la ontología del archivo en sí mismo. [...]. El ADN de una imagen digital es una matriz de píxeles que puede manipularse matemáticamente y permite un conjunto muy diferente de operaciones”14 en comparación con el enfoque iconológico tradicional y artístico-histórico.
Con la omnipresencia de las imágenes operativas y la visión de máquina, “cada vez más imágenes parecen adquirir significado e importancia a través de sus relaciones con otras imágenes y al estar en red” [Cuestionario]. Una vez que la imagen ha sido digitalizada y, por tanto, se convierte en direccionable píxel por píxel, cada uno de sus elementos puede vincularse, compararse y asignarse a elementos en otras imágenes, lo que resulta en una especie de alfabetización de las colecciones de imágenes. Estas hiperimágenes permiten navegar por el archivo de imágenes de maneras impredecibles. Obras de cine como Eye/Machine (partes I-III, Alemania 2001-2003) de Harun Farocki, quien acuñó el término “imagen operativa”,15 ahora también son objeto de experimentación algorítmica en el archivo.
Finalmente, volvamos a la preocupación inicial del «Cuestionario». No sólo la exclusividad de la percepción de la “imagen” «humana» es desplazada por la imagen operativa, sino que la imagen del hombre como autor de imágenes también desaparece. En la famosa observación final de su The Order of Things,Foucault (2009) predice que la imagen del ser humano desaparecerá como la forma de un rostro humano dibujado en la arena de la playa. En tiempos de microchips altamente integrados, esta arena está hecha de silicio, que disuelve la imagen del hombre por “cálculo”, —literalmente “contando con calculi”, es decir, con piedras pequeñas. La imagen corporal del hombre reaparece en la pantalla del ordenador, pero desaparece temporalmente en el canal de medios actual. La metáfora apocalíptica de Foucault se microtemporaliza mediante la computación real, que es el registro, la transducción, el procesamiento, la transmisión y el almacenamiento del hombre como data face.16 Tal imagen de la máquina escapa completamente a la “visión” humana. Todo lo que queda para los humanos es aprender diagramas de circuitos y leer códigos.