‘Zoom e Enhance’ Está Finalmente Aqui

E as suas implicações de vigilância são assustadoras

Fotos cortesia do autor.

Todos nós conhecemos a cena. Dois detectives num stand da polícia numa sala pouco iluminada e cheia de monitores, revendo imagens de vigilância. Um cara técnico (sim, é quase sempre um cara) faz fila imagem após imagem, enquanto os detetives olham, olhando para a tela em concentração. “Não há nada aqui!” insiste um detetive. Eles estão prestes a desistir, quando o outro detetive (nosso herói) grita: “Espere!”

Todos param. “Zoom lá dentro!” diz o detective. O tipo da tecnologia faz um zoom obrigatório num canto granuloso da imagem. “Realça isso!”, diz o detective intones. O técnico toca em algumas teclas, murmura algo sobre algoritmos, e de repente a imagem entra em foco, revelando algum detalhe minúsculo e significativo. O caso é bem aberto!

Esta cena é um clichê de drama de crime tão difundido que inspirou seu próprio vídeo meme com quase um milhão de visualizações.

Cenas como estas levam as pessoas técnicas reais a bananas, porque “ampliar e melhorar” sempre pareceu uma fantasia impossível. Até agora. Graças a duas inovações recentes, “zoom and enhance” está finalmente aqui. Ele tem o potencial de mudar radicalmente a vigilância policial, muitas vezes de forma preocupante – ou pelo menos ajudar a trazer as suas fotos do início dos anos 00s.

A primeira inovação por trás do zoom e do enhance na vida real vem do mundo da fotografia. Até recentemente, os fotógrafos tinham duas opções principais para câmeras digitais: DSLRs profissionais como a série Nikon D, ou câmeras de consumo compactas e baratas, como as que você usaria para fotos de aniversário ou fotos de viagem. As DSLRs tiram ótimas fotos, mas são volumosas e visíveis e podem ser difíceis de operar – não é uma ótima combinação para trabalhos de vigilância. Câmeras compactas raramente têm a qualidade necessária para profissionais de vigilância.

Que tudo começou a mudar por volta de 2015, com o aumento das câmeras sem espelho. Essas câmeras têm o pequeno fator de forma de uma câmera compacta, mas graças aos avanços em chips de imagem impulsionados em parte por smartphones, elas embalam os mesmos sensores de imagem de alta qualidade normalmente encontrados em uma DSLR. Cada vez mais, elas também emprestam softwares complexos de processamento de imagem do mundo dos smartphones, melhorando ainda mais suas capacidades. E, de forma crucial, eles permitem o uso de lentes profissionais – facilmente o fator mais importante para tirar fotos de alta qualidade.

Por alguns milhares de dólares, um profissional de vigilância ou força policial pode agora adquirir câmeras minúsculas e fáceis de usar que tiram fotos melhores do que as melhores câmeras profissionais de apenas alguns anos atrás.

O resultado final é uma câmera minúscula que você pode carregar e usar discretamente, enquanto tira fotos extremamente detalhadas e de alta resolução. A Q, uma câmera sem espelho da lendária fabricante alemã de câmeras Leica, em grande parte deu o pontapé inicial na tendência. O último modelo Q pesa apenas 1,4 libras e tira fotos de 47 megapixels através de uma lente obscenamente nítida que vê mais detalhes do que o olho humano. Com uma classificação ISO de 50.000 (15 vezes maior que a obtida pelos filmes analógicos mais rápidos), também pode ver essencialmente no escuro.

O Leica Q2. Foto: Leica

Competições de baixo preço, como a Sony Alpha, têm surgido desde então. Por alguns milhares de dólares, um profissional de vigilância ou força policial pode agora comprar pequenas câmaras fáceis de usar que tiram melhores fotografias do que as melhores câmaras profissionais de há apenas alguns anos atrás. O zoom das fotos tiradas nestas câmaras pode, por vezes, dar vontade de usar o zoom e melhorar. O detalhe que capturam – especialmente emparelhado com software moderno – é notável.

Mas combinar imagens de câmeras sem espelho com sensoriamento compressivo, e ampliar e melhorar está realmente aqui. O sensoriamento compressivo permite ampliar massivamente uma imagem sem uma grande perda de qualidade. A tecnologia existe desde o início dos anos 2000, mas ganhou destaque em 2010 quando pesquisadores mostraram como ela poderia ser usada para reconstruir uma imagem do Presidente Barack Obama usando uma pequena amostra de pixels distribuídos aleatoriamente.

Em 2017, o Google mostrou como os princípios de sensoriamento compressivo poderiam ser combinados com redes neurais para reconstruir imagens degradadas ou de baixa qualidade em um processo chamado super-resolução A.I. A tecnologia funciona começando com imagens de amostra – muitas vezes de rostos ou salas – e deliberadamente confundindo-as, fazendo-as passar por um terrível sistema de compressão JPEG, e similares.

Uma rede neural então olha para as imagens degradadas, compara-as com suas contrapartes de alta qualidade, e aprende como as duas se relacionam. Essencialmente, a rede ensina a si mesma todas as formas como uma imagem digital pode se degradar. Uma vez que ela sabe disso, o processo é invertido. O sistema recebe uma imagem de baixa qualidade ou degradada, e com base em seu treinamento, constrói uma versão de alta qualidade, não degradada do zero.

Embora o Google tenha saído em grande parte do campo, a super-resolução A.I. decolou. Serviços como o Big JPG permitem aos utilizadores carregar uma fotografia de baixa qualidade e ter instantaneamente uma ampliação de 400% ou mais, muitas vezes com uma perda mínima de qualidade. Os plugins do Photoshop têm fornecido tecnologia semelhante aos fotógrafos, que a utilizam para remover a desfocagem e a nitidez das imagens. A minha empresa de fotografia A.I.-driven photography usa frequentemente a tecnologia para melhorar as fotografias de câmaras digitais tiradas no início dos anos 2000, permitindo que mesmo estas primeiras imagens de baixa qualidade cumpram os padrões actuais para uso em publicações.

A tecnologia, no entanto, também está a ser usada para vigilância. Rapidamente após seu desenvolvimento, os pesquisadores começaram a mostrar como a super-resolução poderia ser usada para aumentar as fotos de vigilância de baixa resolução ou molduras de vídeos de vigilância. Outros focaram no uso da tecnologia para aplicações específicas, como o reconhecimento de placas de carro. E muitos grupos se concentraram na super-resolução para imagens de reconhecimento facial, chegando ao ponto de desenvolver algoritmos especializados para melhorar as imagens faciais.

Vendedores de eventos integraram esses algoritmos em produtos de software dedicados. Topaz Labs, na minha experiência, é o mais avançado. Emparelhe seu produto Gigapixel AI com a saída de uma câmera moderna sem espelho, e você tem zoom e aprimoramento que rivaliza com os sistemas imaginados em shows como o CSI.

Aqui, por exemplo, está uma foto de um restaurante Jamba Juice em Marin County, Califórnia, tirada na minha câmera Leica Q sem espelho.

Restaurante Jamba Juice tirada numa câmera Leica Q sem espelho. Fotos cortesia do autor.

Tirei isto do outro lado de uma rua, com a câmera do tamanho da palma da mão pendurada no meu pescoço. Eu então passei a foto pelo software Gigapixel AI da Topaz, ampliando-o em 400% e usando os algoritmos proprietários de reconstrução facial e nitidez da empresa.

Zooming in to full size na imagem realçada, você pode ver alguns detalhes incríveis. Através da janela frontal do restaurante, você pode ver claramente um patrono esperando na fila e examinando um menu.

A caixa vermelha mostra a região que foi ampliada e realçada na foto abaixo.

Pessoas são visíveis após a aplicação do zoom e do realce.

Você pode até ver que ele está usando uma máscara cirúrgica azul. Ótimo trabalho mantendo-se seguro, homem batido desconhecido! Os folhetos afixados na porta também são visíveis, incluindo alguns dos gráficos no folheto. Você pode ver os clientes dentro colocando seus pedidos.

Zooming e melhorando outra parte da imagem, você pode ver o texto em sinais no fundo distante (“Jamba Curbside Pickup”) e como eles foram fixados aos pilares usando fita amarela. E ao longe, você pode ver os manequins em outra loja próxima e restaurantes comendo em mesas ao ar livre.

A caixa vermelha mostra a região que foi ampliada e realçada na foto abaixo.

O texto é visível nos sinais ao fundo, após a aplicação do zoom e do realce.

Com um zoom mais extremo e um ajuste para a exposição, você pode ver claramente a assinatura da loja Blendtec blenders no interior do balcão.

>

A caixa vermelha mostra a região que foi ampliada e realçada na foto abaixo.

Esquerda: Imagem ampliada e realçada do liquidificador dentro do restaurante. Direita: Um modelo semelhante de liquidificador Blendtec para comparação. Foto: Blendtec via PRWeb

Identificação do misturador, claro, não é o uso mais inovador de uma nova tecnologia. Mas quando você aplica zoom e melhora em um contexto de vigilância, as coisas ficam assustadoras rapidamente.

Aqui, por exemplo, está uma foto que tirei de um protesto de Black Lives Matter em Times Square em 2016.

Protesto de Black Lives Matter em 7 de julho de 2016. A caixa vermelha no centro esquerdo da imagem é ampliada e realçada na foto abaixo.

Aplicando o zoom e realçando, você pode ver claramente os rostos dos policiais na parte de trás da multidão. Com a reconstrução facial aplicada, estas imagens seriam provavelmente suficientemente boas para encontrar correspondências numa base de dados de reconhecimento facial.

O rosto de um agente da polícia a partir do fundo da multidão é claramente visível após a aplicação de zoom e realce. Seus olhos são vermelhos com barra preta para proteger a identidade do policial.

Combinando esta tecnologia com sistemas de reconhecimento facial como Clearview AI tornaria trivial identificar um grande número de pessoas em uma multidão de manifestantes. Um policial à paisana ou agente federal fazendo-se passar por um turista poderia facilmente caminhar por uma multidão de manifestantes enquanto tirava fotos em uma minúscula câmera sem espelho. As fotos poderiam ser tiradas de um sistema de super-resolução, ampliando-as massivamente e melhorando os rostos presentes.

Rostos individuais poderiam então ser retirados da imagem e correr através de um sistema como o Clearview’s para identificar cada indivíduo pelo nome. As forças policiais e outras agências já estão a utilizar a I.A. para identificar diferentes acções (como arrombar um veículo ou vadiar) e para procurar imagens de vigilância de pessoas com base nas suas descrições físicas. Ainda não está claro se alguma está a usar super-resolução, mas sem dúvida que isso virá. A tecnologia de reconstrução facial irá provavelmente melhorar também – muitas faces ainda hoje saem distorcidas quando melhoradas, mas os erros de reconstrução facial irão provavelmente diminuir com o tempo.

Temos de assegurar que tecnologias como o zoom e o melhoramento estão disponíveis para a aplicação da lei quando são verdadeiramente necessárias. Mas também precisamos ter certeza de que elas não serão abusadas.

Como a tecnologia melhora, você pode nem mesmo precisar de uma câmera sem espelho ou outras câmeras de alta qualidade. A super-resolução pode acabar se tornando boa o suficiente para executar funções de zoom e melhoria na saída de baixa resolução de uma câmera de vigilância tradicional, identificando cada indivíduo em uma multidão usando imagens de câmeras de trânsito, câmeras de vigilância de uma loja ou casa próxima, ou até mesmo um zangão em círculo. Ele também poderia um dia ser aplicado a fotos tiradas em um smartphone ou mesmo às fotos de baixa resolução exibidas em plataformas de mídia social como Instagram.

Como com qualquer nova tecnologia de vigilância, garantir o uso responsável de zoom e aprimoramento é uma questão de estabelecer as leis e políticas corretas. A Quarta Emenda da Constituição dos Estados Unidos já oferece proteção contra buscas sem um mandado. Os tribunais têm pesado questões de novas tecnologias no passado – por exemplo, verificar se a vigilância com lentes teleobjectivas viola a Quarta Emenda. Eles geralmente decidiram que tecnologias amplamente disponíveis como as lentes de zoom podem ser usadas em muitos contextos, mas tecnologias especializadas como radar que vê através de paredes não podem.

Ainda não está claro onde zoom e melhoria cairiam nesse espectro. A tecnologia pode ser vista como apenas mais uma versão da lente de zoom em uma câmera tradicional. Mas dado seus elementos de inteligência artificial, os tribunais podem achar que ela é muito especializada de uma tecnologia para ser mobilizada sem os devidos mandados de busca.

Por enquanto, a tecnologia é muito nova para que estes precedentes tenham sido estabelecidos. Como cidadãos, o melhor que podemos fazer é estar conscientes da sua existência. Se você estiver em um protesto ou outro evento sensível, assuma que você está sendo vigiado e fotografado. Mesmo que você não veja alguém com uma câmera com aparência profissional, as autoridades ainda podem estar capturando a sua imagem com qualidade suficiente para olhar para você usando o reconhecimento facial e identificá-lo pelo nome.

Também podemos informar proativamente os legisladores sobre quais as novas tecnologias com as quais nos sentimos confortáveis e quais as que não estamos. A raiva popular sobre as tecnologias de reconhecimento facial levou a uma proposta de lei para proibir o uso desta tecnologia no policiamento. Precisamos garantir que tecnologias como o zoom e o aprimoramento estejam disponíveis para a aplicação da lei quando elas forem realmente necessárias. Mas também precisamos ter certeza de que elas não sejam abusadas.

Como a ficção científica fez um bom trabalho de nos preparar para viagens espaciais e computadores, shows como o CSI fizeram um bom trabalho de nos apresentar o conceito de zoom e aprimoramento antes que ele existisse. Mas quando você vai além do mundo imaginado de um bom policial combatendo criminosos do mal, a ética do mundo real da tecnologia como o zoom e o aprimoramento se desfocam rapidamente.

Deixe uma resposta

O seu endereço de email não será publicado.