Todos conocemos la escena. Dos detectives de un programa policial están en una sala poco iluminada y llena de monitores, revisando imágenes de vigilancia. Un técnico (sí, casi siempre es un hombre) pone en cola una imagen tras otra mientras los detectives miran concentrados la pantalla. “¡Aquí no hay nada!”, insiste un detective. Están a punto de rendirse, cuando el otro detective (nuestro héroe) grita: “¡Esperad!”
Todos se detienen. “¡Acércate ahí!”, dice el detective. El técnico, por su parte, se acerca a una esquina granulada de la imagen. “¡Aumenta eso!”, dice el detective. El técnico pulsa algunas teclas, murmura algo sobre algoritmos y, de repente, la imagen se enfoca, revelando algún pequeño detalle significativo. Esta escena es un cliché de los dramas policíacos tan extendido que ha inspirado su propio vídeo meme con casi un millón de visitas.
Escenas como ésta vuelven locos a los verdaderos técnicos, porque “ampliar y mejorar” siempre ha parecido una fantasía imposible. Hasta ahora. Gracias a dos innovaciones recientes, el zoom y la mejora ya están aquí. Tiene el potencial de cambiar radicalmente la vigilancia policial, a menudo de forma preocupante, o al menos ayudarte a recuperar tus fotos de principios de los años 00.
La primera innovación detrás del zoom y la mejora en la vida real proviene del mundo de la fotografía. Hasta hace poco, los fotógrafos tenían dos opciones principales para las cámaras digitales: las DSLR profesionales, como la serie D de Nikon, o las cámaras compactas de consumo baratas, como las que se utilizan para las instantáneas de cumpleaños o de viaje. Las DSLR hacen buenas fotos, pero son voluminosas y llamativas y pueden ser difíciles de manejar, lo que no es una buena combinación para el trabajo de vigilancia. Las cámaras compactas rara vez tienen la calidad necesaria para los profesionales de la vigilancia.
Todo eso empezó a cambiar alrededor de 2015, con el auge de las cámaras sin espejo. Estas cámaras tienen el diminuto formato de una cámara compacta, pero gracias a los avances en los chips de imagen impulsados en parte por los smartphones, incorporan los mismos sensores de imagen de alta calidad que suelen encontrarse en las DSLR. Cada vez más, también toman prestado el complejo software de procesamiento de imágenes del mundo de los smartphones, lo que mejora aún más sus capacidades. Y, lo que es más importante, permiten el uso de objetivos profesionales, sin duda el factor más importante para hacer fotos de alta calidad.
Por unos pocos miles de dólares, un profesional de la vigilancia o un cuerpo de policía puede adquirir ahora cámaras diminutas y fáciles de usar que hacen mejores fotos que las mejores cámaras profesionales de hace unos años.
El resultado final es una cámara diminuta que se puede llevar y utilizar sin que se note, al tiempo que hace fotos extremadamente detalladas y de alta resolución. La Q, una cámara sin espejo del legendario fabricante de cámaras alemán Leica, inició en gran medida esta tendencia. El último modelo de la Q pesa sólo 1,4 libras y hace fotos de 47 megapíxeles a través de un objetivo obscenamente nítido que ve más detalles que el ojo humano. Con un índice ISO de 50.000 (15 veces superior al alcanzado por las películas analógicas más rápidas), también puede ver esencialmente en la oscuridad.
Desde entonces han surgido competidores de menor precio, como la Sony Alpha. Por unos pocos miles de dólares, un profesional de la vigilancia o un cuerpo de policía puede adquirir ahora cámaras diminutas y fáciles de usar que hacen mejores fotos que las mejores cámaras profesionales de hace unos años. Hacer zoom en las fotos tomadas con estas cámaras puede parecer a veces como usar el zoom y mejorar. El detalle que capturan -especialmente si se combinan con el software moderno- es notable.
Pero si se combinan las imágenes de las cámaras sin espejo con el sensor de compresión, el zoom y la mejora están realmente presentes. La tecnología de compresión permite ampliar una imagen de forma masiva sin que se produzca una gran pérdida de calidad. Esta tecnología existe desde principios de la década de 2000, pero cobró protagonismo en 2010 cuando los investigadores demostraron cómo podía utilizarse para reconstruir una imagen del presidente Barack Obama utilizando una pequeña muestra de píxeles distribuidos al azar.
En 2017, Google demostró cómo los principios de la detección compresiva podían combinarse con las redes neuronales para reconstruir imágenes degradadas o de baja calidad en un proceso denominado superresolución de inteligencia artificial. La tecnología funciona comenzando con imágenes de muestra -a menudo de caras o habitaciones- y estropeándolas deliberadamente haciéndolas borrosas, pasándolas a través de un terrible sistema de compresión JPEG, y cosas por el estilo.
Una red neuronal entonces mira las imágenes degradadas, las compara con sus contrapartes de alta calidad, y aprende cómo se relacionan las dos. Esencialmente, la red se enseña a sí misma todas las formas en que una imagen digital puede degradarse. Una vez que lo sabe, el proceso se invierte. El sistema recibe una imagen de baja calidad o degradada y, basándose en su entrenamiento, construye una versión de alta calidad no degradada a partir de cero.
Aunque Google ha abandonado en gran medida este campo, la superresolución de la inteligencia artificial ha despegado. Servicios como Big JPG permiten a los usuarios subir una fotografía de baja calidad y ampliarla al instante en un 400% o más, a menudo con una mínima pérdida de calidad. Los plugins de Photoshop han proporcionado una tecnología similar a los fotógrafos, que la utilizan para eliminar la borrosidad y afinar las imágenes. Mi empresa de fotografía, impulsada por la inteligencia artificial, utiliza a menudo esta tecnología para mejorar las fotos de las cámaras digitales tomadas a principios de la década de 2000, lo que permite que incluso estas primeras imágenes de baja calidad cumplan con los estándares actuales para su uso en publicaciones.
La tecnología, sin embargo, también se está utilizando para la vigilancia. Poco después de su desarrollo, los investigadores empezaron a mostrar cómo la superresolución podía utilizarse para mejorar las fotos de vigilancia de baja resolución o los fotogramas de los vídeos de vigilancia. Otros se centraron en utilizar la tecnología para aplicaciones específicas, como el reconocimiento de matrículas. Y muchos grupos se han centrado en la superresolución para imágenes de reconocimiento facial, llegando a desarrollar algoritmos especializados para mejorar las imágenes faciales.
Varios proveedores han integrado estos algoritmos en productos de software específicos. Topaz Labs, según mi experiencia, es el más avanzado. Si se combina su producto Gigapixel AI con la salida de una cámara sin espejo moderna, se obtiene un zoom y una mejora que rivalizan con los sistemas imaginados en programas como CSI.
Aquí, por ejemplo, hay una foto de un restaurante Jamba Juice en Marin County, California, tomada con mi cámara sin espejo Leica Q.
La tomé desde el otro lado de la calle, con la cámara del tamaño de la palma de la mano colgada del cuello. A continuación, pasé la foto por el software Gigapixel AI de Topaz, aumentando la escala en un 400% y utilizando los algoritmos de reconstrucción facial y de nitidez propios de la empresa.
Al ampliar el tamaño de la imagen mejorada, se pueden ver algunos detalles increíbles. A través del escaparate del restaurante, se puede ver claramente a un cliente esperando en la cola y examinando un menú.
Incluso se puede ver que lleva una máscara quirúrgica azul. ¡Gran trabajo manteniéndose a salvo, desconocido hombre de los batidos! También se ven los folletos colocados en la puerta, incluso algunos de los gráficos del folleto. Se puede ver a los clientes en el interior haciendo sus pedidos.
Al hacer zoom y mejorar otra parte de la imagen, se puede ver el texto de los carteles en el fondo lejano (“Jamba Curbside Pickup”) y cómo se han fijado a los pilares con cinta amarilla. Y a lo lejos, se pueden ver los maniquíes de otra tienda cercana y los comensales comiendo en mesas exteriores.
Con un zoom más extremo y un ajuste de la exposición, se pueden distinguir claramente las licuadoras Blendtec de la tienda en el mostrador del interior.
Aplicando el zoom y la mejora, se pueden ver claramente los rostros de los agentes de policía en el fondo de la multitud. Con la reconstrucción facial aplicada, estas imágenes probablemente serían lo suficientemente buenas como para encontrar coincidencias en una base de datos de reconocimiento facial.
Combinando esta tecnología con sistemas de reconocimiento facial como Clearview AI sería trivial identificar a un gran número de personas en una multitud de manifestantes. Un policía de paisano o un agente federal que se hiciera pasar por un turista podría atravesar fácilmente una multitud de manifestantes mientras hace fotos con una pequeña cámara sin espejo. Las fotos podrían pasarse por un sistema de superresolución, ampliándolas masivamente y realzando los rostros presentes.
Los rostros individuales podrían entonces extraerse de la imagen y pasarse por un sistema como el de Clearview para identificar a cada individuo por su nombre. Al parecer, las fuerzas policiales y otros organismos ya utilizan la Inteligencia Artificial para identificar diferentes acciones (como entrar en un vehículo o merodear) y para buscar personas en las imágenes de vigilancia basándose en sus descripciones físicas. No está claro si alguno utiliza ya la superresolución, pero no cabe duda de que lo hará. Es probable que la tecnología de reconstrucción facial también mejore: muchos rostros actuales siguen apareciendo distorsionados cuando se mejoran, pero es probable que los errores de reconstrucción facial disminuyan con el tiempo.
Tenemos que asegurarnos de que tecnologías como el zoom y la mejora estén a disposición de las fuerzas del orden cuando sean realmente necesarias. Pero también tenemos que asegurarnos de que no se abusa de ellas.
A medida que la tecnología mejore, puede que ni siquiera se necesite una cámara sin espejo u otras cámaras de alta calidad. La superresolución podría llegar a ser lo suficientemente buena como para realizar funciones de zoom y mejora en la salida de baja resolución de una cámara de vigilancia tradicional, identificando a todos los individuos de una multitud utilizando las imágenes de las cámaras de tráfico, de las cámaras de vigilancia de una tienda o de una casa cercana, o incluso de un dron que dé vueltas. También podría aplicarse algún día a las fotos tomadas con un smartphone o incluso a las fotos de baja resolución que aparecen en plataformas de redes sociales como Instagram.
Como ocurre con cualquier nueva tecnología de vigilancia, garantizar un uso responsable del zoom y mejorar es una cuestión de establecer las leyes y políticas adecuadas. La Cuarta Enmienda de la Constitución de Estados Unidos ya ofrece protección contra los registros sin orden judicial. Los tribunales han sopesado cuestiones relacionadas con las nuevas tecnologías en el pasado, por ejemplo, examinando si la vigilancia con teleobjetivos viola la Cuarta Enmienda. Por lo general, han dictaminado que la tecnología ampliamente disponible, como las lentes de zoom, puede utilizarse en muchos contextos, pero la tecnología especializada, como el radar que ve a través de las paredes, no puede hacerlo.
Todavía no está claro qué lugar ocupan el zoom y la mejora en ese espectro. La tecnología podría verse como una versión más de la lente de zoom de una cámara tradicional. Pero dados sus elementos de inteligencia artificial, los tribunales podrían considerar que se trata de una tecnología demasiado especializada para ser movilizada sin las debidas órdenes de registro.
Por ahora, la tecnología es demasiado nueva para que se hayan establecido estos precedentes. Como ciudadanos, lo mejor que podemos hacer es ser conscientes de su existencia. Si estás en una protesta u otro evento sensible, asume que estás siendo vigilado y fotografiado. Aunque no veas a nadie con una cámara de aspecto profesional, las autoridades podrían estar captando tu imagen con la suficiente calidad como para buscarte mediante el reconocimiento facial e identificarte por tu nombre.
También podemos informar proactivamente a los legisladores sobre con qué nuevas tecnologías nos sentimos cómodos y con cuáles no. La indignación popular por las tecnologías de reconocimiento facial llevó a una propuesta de ley para prohibir el uso de esta tecnología en la policía. Tenemos que asegurarnos de que tecnologías como el zoom y la mejora estén a disposición de las fuerzas del orden cuando sean realmente necesarias. Pero también tenemos que asegurarnos de que no se abusa de ellas.
Así como la ciencia ficción hizo un buen trabajo preparándonos para los viajes espaciales y los ordenadores, programas como CSI han hecho un buen trabajo introduciéndonos en el concepto de zoom y mejora antes de que existiera. Pero cuando se va más allá del mundo imaginario de un policía bueno que lucha contra criminales malvados, la ética del mundo real de la tecnología como el zoom y la mejora se vuelve borrosa rápidamente.