And its surveillance implications are scary
Wir alle kennen die Szene. Zwei Ermittler einer Polizeiserie stehen in einem schwach beleuchteten Raum voller Monitore und sehen sich Überwachungsbilder an. Ein Techniker (ja, es ist fast immer ein Mann) stellt ein Bild nach dem anderen in die Warteschlange, während die Ermittler konzentriert auf den Bildschirm blinzeln. “Hier ist nichts!”, sagt ein Beamter. Sie wollen schon aufgeben, als der andere Detektiv (unser Held) ruft: “Warte!”
Alle bleiben stehen. “Zoom da rein!”, sagt der Detektiv. Der Techniker zoomt zuvorkommend auf eine körnige Ecke des Bildes. “Verbessern Sie das!”, sagt der Detektiv. Der Techniker tippt auf ein paar Tasten, murmelt etwas über Algorithmen, und plötzlich wird das Bild scharf und zeigt ein winziges, wichtiges Detail. Der Fall ist geknackt!
Diese Szene ist ein so allgegenwärtiges Krimi-Klischee, dass sie ein eigenes Meme-Video mit fast einer Million Aufrufen inspiriert hat.
Szenen wie diese treiben echte Techniker in den Wahnsinn, denn “Zoomen und Verbessern” war schon immer eine unmögliche Vorstellung. Bis jetzt. Dank zweier neuer Innovationen ist “Zoom and Enhance” nun endlich da. Es hat das Potenzial, die polizeiliche Überwachung radikal zu verändern, oft auf besorgniserregende Weise – oder Ihnen zumindest dabei zu helfen, Ihre Fotos aus den frühen 00er Jahren wieder aufleben zu lassen.
Die erste Innovation, die hinter Zoom und Verbessern im wirklichen Leben steht, kommt aus der Welt der Fotografie. Bis vor kurzem gab es für Fotografen zwei Hauptoptionen für Digitalkameras: professionelle DSLRs wie die Nikon D-Serie oder billige Kompaktkameras für Privatanwender, wie man sie für Geburtstags- oder Reiseschnappschüsse verwendet. DSLRs machen großartige Fotos, aber sie sind sperrig und auffällig und können schwer zu bedienen sein – keine gute Kombination für Überwachungsaufgaben. Kompaktkameras haben selten die Qualität, die für professionelle Überwachungsaufgaben erforderlich ist.
Das alles begann sich 2015 mit dem Aufkommen der spiegellosen Kameras zu ändern. Diese Kameras haben den winzigen Formfaktor einer Kompaktkamera, aber dank der Fortschritte bei den Bildgebungs-Chips, die zum Teil durch Smartphones vorangetrieben wurden, verfügen sie über die gleichen hochwertigen Bildsensoren, die normalerweise in einer DSLR zu finden sind. Zunehmend übernehmen sie auch komplexe Bildverarbeitungssoftware aus der Smartphone-Welt, was ihre Fähigkeiten weiter verbessert. Und ganz entscheidend ist, dass sie die Verwendung professioneller Objektive ermöglichen – der mit Abstand wichtigste Faktor für die Aufnahme hochwertiger Fotos.
Für ein paar Tausend Dollar kann ein Überwachungsprofi oder eine Polizeibehörde jetzt winzige, einfach zu bedienende Kameras erwerben, die bessere Fotos machen als die besten Profikameras von vor ein paar Jahren.
Das Endergebnis ist eine winzige Kamera, die man unauffällig mit sich führen und verwenden kann, während sie extrem detaillierte, hochauflösende Fotos macht. Die Q, eine spiegellose Kamera des legendären deutschen Kameraherstellers Leica, gab den Anstoß zu diesem Trend. Das neueste Q-Modell wiegt nur 1,4 Pfund und nimmt Fotos mit 47 Megapixeln durch ein gestochen scharfes Objektiv auf, das mehr Details erkennt als das menschliche Auge. Mit einer ISO-Einstufung von 50.000 (15-mal höher als bei den schnellsten analogen Filmen) kann sie auch im Dunkeln sehen.
Billigere Konkurrenten, wie die Sony Alpha, sind inzwischen aufgetaucht. Für ein paar tausend Dollar kann ein Überwachungsprofi oder eine Polizeibehörde jetzt winzige, einfach zu bedienende Kameras kaufen, die bessere Fotos machen als die besten professionellen Kameras von vor ein paar Jahren. Das Heranzoomen von Fotos, die mit diesen Kameras aufgenommen wurden, kann sich manchmal anfühlen, als würde man zoomen und vergrößern. Der Detailreichtum, den sie einfangen – vor allem in Verbindung mit moderner Software – ist bemerkenswert.
Aber wenn man die Bilder spiegelloser Kameras mit Compressive Sensing kombiniert, ist Zoom und Enhancement wirklich da. Compressive Sensing ermöglicht es, ein Bild ohne großen Qualitätsverlust massiv zu vergrößern. Diese Technologie gibt es seit Anfang der 2000er Jahre, aber sie wurde 2010 bekannt, als Forscher zeigten, wie man damit ein Bild von Präsident Barack Obama anhand einer winzigen Stichprobe zufällig verteilter Pixel rekonstruieren kann.
Im Jahr 2017 zeigte Google, wie die Prinzipien des Compressive Sensing mit neuronalen Netzen kombiniert werden können, um verschlechterte oder minderwertige Bilder in einem Prozess namens KI-Superresolution zu rekonstruieren. Die Technik funktioniert, indem man mit Beispielbildern – oft von Gesichtern oder Räumen – beginnt und sie absichtlich verunstaltet, indem man sie unscharf macht, sie durch ein schlechtes JPEG-Komprimierungssystem laufen lässt usw.
Ein neuronales Netzwerk betrachtet dann die verschlechterten Bilder, vergleicht sie mit ihren hochwertigen Gegenstücken und lernt, wie die beiden zusammenhängen. Im Wesentlichen lernt das Netz selbst alle Möglichkeiten, wie ein digitales Bild verschlechtert werden kann. Sobald es dies weiß, wird der Prozess umgedreht. Dem System wird ein minderwertiges oder verschlechtertes Bild vorgelegt, und auf der Grundlage seines Trainings konstruiert es eine hochwertige, nicht verschlechterte Version von Grund auf neu.
Auch wenn sich Google inzwischen weitgehend aus diesem Bereich zurückgezogen hat, hat die KI-Superauflösung einen Aufschwung erlebt. Mit Diensten wie Big JPG können Nutzer ein Foto von geringer Qualität hochladen und es sofort um 400 % oder mehr hochskalieren lassen, oft mit minimalem Qualitätsverlust. Photoshop-Plugins haben Fotografen eine ähnliche Technologie zur Verfügung gestellt, mit der sie Unschärfen entfernen und Bilder schärfen können. Meine KI-gesteuerte Fotofirma setzt die Technologie häufig ein, um Digitalkamerafotos aus den frühen 2000er Jahren hochzuskalieren, so dass selbst diese qualitativ minderwertigen Bilder den heutigen Standards für die Verwendung in Veröffentlichungen entsprechen.
Die Technologie wird aber auch zur Überwachung eingesetzt. Schon bald nach ihrer Entwicklung begannen Forscher zu zeigen, wie die Superauflösung genutzt werden kann, um Überwachungsfotos mit geringer Auflösung oder Bilder aus Überwachungsvideos zu vergrößern. Andere konzentrierten sich auf den Einsatz der Technologie für gezielte Anwendungen wie die Nummernschilderkennung. Und viele Gruppen haben sich auf die Superauflösung von Gesichtserkennungsbildern konzentriert und sind so weit gegangen, spezielle Algorithmen zur Verbesserung von Gesichtsbildern zu entwickeln.
Viele Anbieter haben diese Algorithmen in spezielle Softwareprodukte integriert. Topaz Labs ist meiner Erfahrung nach am weitesten fortgeschritten. Kombinieren Sie ihr Gigapixel-KI-Produkt mit der Leistung einer modernen spiegellosen Kamera, und Sie haben einen Zoom und eine Verbesserung, die mit den vorgestellten Systemen in Serien wie CSI konkurrieren können.
Hier ist zum Beispiel ein Foto von einem Jamba Juice Restaurant in Marin County, Kalifornien, aufgenommen mit meiner Leica Q spiegellosen Kamera.
Dieses Foto habe ich von der anderen Straßenseite aus aufgenommen, wobei ich die handtellergroße Kamera um den Hals trug. Dann habe ich das Foto durch die Software Gigapixel AI von Topaz laufen lassen, es um 400 % hochskaliert und die firmeneigenen Algorithmen zur Gesichtsrekonstruktion und -schärfung verwendet.
Zoomt man das verbesserte Bild in voller Größe heran, kann man einige unglaubliche Details erkennen. Durch das Schaufenster des Restaurants kann man deutlich einen Gast sehen, der in der Schlange wartet und eine Speisekarte studiert.
Man kann sogar sehen, dass er eine blaue OP-Maske trägt. Gut gemacht, unbekannter Smoothie-Mann, dass du dich in Sicherheit gebracht hast! Die an der Tür ausgehängten Flyer sind ebenfalls zu sehen, einschließlich einiger der Grafiken auf dem Flyer. Man kann sehen, wie die Kunden drinnen ihre Bestellungen aufgeben.
Zoomt man einen anderen Teil des Bildes und vergrößert ihn, kann man den Text auf den Schildern im Hintergrund sehen (“Jamba Curbside Pickup”) und wie sie mit gelbem Klebeband an den Säulen befestigt wurden. Und in der Ferne sieht man die Schaufensterpuppen in einem anderen Geschäft in der Nähe und Gäste, die an Tischen im Freien essen.
Mit extremerem Zoom und einer Optimierung der Belichtung kann man deutlich die Blendtec-Mixer auf der Theke im Inneren des Geschäfts erkennen.
Die Identifizierung von Blendern ist natürlich nicht die bahnbrechendste Anwendung einer neuen Technologie. Aber wenn man Zoom und Vergrößerung in einem Überwachungskontext anwendet, werden die Dinge schnell beängstigend.
Hier ist zum Beispiel ein Foto, das ich 2016 von einer Black Lives Matter-Demonstration am Times Square aufgenommen habe.
Wenn man zoomt und vergrößert, kann man deutlich die Gesichter der Polizisten ganz hinten in der Menge erkennen. Mit einer Gesichtsrekonstruktion wären diese Bilder wahrscheinlich gut genug, um Übereinstimmungen in einer Gesichtserkennungsdatenbank zu finden.
Kombiniert man diese Technologie mit Gesichtserkennungssystemen wie Clearview AI, wäre es trivial, eine große Anzahl von Personen in einer Menge von Demonstranten zu identifizieren. Ein Polizeibeamter in Zivil oder ein Bundesbeamter, der sich als Tourist ausgibt, könnte problemlos durch eine Menge von Demonstranten gehen und dabei mit einer winzigen spiegellosen Kamera Fotos machen. Die Fotos könnten durch ein Super-Resolution-System laufen, das sie massiv vergrößert und die Gesichter hervorhebt.
Die einzelnen Gesichter könnten dann aus dem Bild herausgezogen werden und durch ein System wie das von Clearview laufen, um jede Person mit ihrem Namen zu identifizieren. Berichten zufolge nutzen Polizeibehörden und andere Behörden bereits KI, um verschiedene Handlungen zu identifizieren (z. B. Einbruch in ein Fahrzeug oder Herumlungern) und Überwachungsbilder nach Personen auf der Grundlage ihrer Körperbeschreibungen zu durchsuchen. Es ist unklar, ob die Super-Resolution bereits eingesetzt wird, aber das wird zweifellos noch kommen. Auch die Technik zur Gesichtsrekonstruktion wird sich wahrscheinlich verbessern – viele Gesichter sind heute noch verzerrt, wenn sie vergrößert werden, aber die Fehler bei der Gesichtsrekonstruktion werden mit der Zeit wahrscheinlich abnehmen.
Wir müssen sicherstellen, dass Technologien wie Zoom und Vergrößerung den Strafverfolgungsbehörden zur Verfügung stehen, wenn sie wirklich gebraucht werden. Aber wir müssen auch sicherstellen, dass sie nicht missbraucht werden.
Wenn sich die Technik verbessert, braucht man vielleicht nicht einmal eine spiegellose Kamera oder andere hochwertige Kameras. Die Superauflösung könnte schließlich gut genug sein, um Zoom- und Vergrößerungsfunktionen auf dem niedrig auflösenden Ausgang einer herkömmlichen Überwachungskamera durchzuführen und jede Person in einer Menschenmenge anhand von Aufnahmen von Verkehrskameras, Überwachungskameras in einem Geschäft oder einem nahe gelegenen Haus oder sogar einer kreisenden Drohne zu identifizieren. Sie könnte eines Tages auch auf Fotos angewandt werden, die mit einem Smartphone aufgenommen wurden, oder sogar auf Fotos mit geringer Auflösung, die auf Social-Media-Plattformen wie Instagram angezeigt werden.
Wie bei jeder neuen Überwachungstechnologie ist die Gewährleistung eines verantwortungsvollen Einsatzes von Zoom und Enhancement eine Frage der richtigen Gesetze und Richtlinien. Der vierte Zusatzartikel der US-Verfassung bietet bereits Schutz vor Durchsuchungen ohne Durchsuchungsbefehl. Die Gerichte haben sich in der Vergangenheit mit neuen Technologien befasst – zum Beispiel mit der Frage, ob die Überwachung mit Teleobjektiven gegen den Vierten Verfassungszusatz verstößt. Sie haben in der Regel entschieden, dass weit verbreitete Technologien wie Zoom-Objektive in vielen Zusammenhängen verwendet werden können, spezielle Technologien wie Radar, das durch Wände hindurch sieht, jedoch nicht.
Es ist noch nicht klar, wo Zoom und Enhance in diesem Spektrum liegen würden. Die Technologie könnte als eine weitere Version des Zoomobjektivs einer herkömmlichen Kamera betrachtet werden. Da sie jedoch Elemente künstlicher Intelligenz enthält, könnten die Gerichte zu dem Schluss kommen, dass es sich um eine zu spezielle Technologie handelt, die ohne entsprechende Durchsuchungsbefehle eingesetzt werden kann.
Noch ist die Technologie zu neu, als dass es bereits Präzedenzfälle gäbe. Das Beste, was wir als Bürger tun können, ist, sich ihrer Existenz bewusst zu sein. Wenn Sie an einer Demonstration oder einer anderen sensiblen Veranstaltung teilnehmen, sollten Sie davon ausgehen, dass Sie überwacht und fotografiert werden. Selbst wenn Sie niemanden mit einer professionell aussehenden Kamera sehen, könnten die Behörden Ihr Bild in einer Qualität aufnehmen, die ausreicht, um Sie mit Hilfe der Gesichtserkennung zu erkennen und namentlich zu identifizieren.
Wir können die Gesetzgeber auch proaktiv darüber informieren, mit welchen neuen Technologien wir einverstanden sind und mit welchen nicht. Der Unmut der Bevölkerung über Gesichtserkennungstechnologien hat zu einem Gesetzentwurf geführt, der den Einsatz dieser Technologie in der Polizeiarbeit verbieten soll. Wir müssen sicherstellen, dass Technologien wie Zoom und Enhance den Strafverfolgungsbehörden zur Verfügung stehen, wenn sie wirklich gebraucht werden. Aber wir müssen auch dafür sorgen, dass sie nicht missbraucht werden.
Wie die Science-Fiction uns auf die Raumfahrt und den Computer vorbereitet hat, so haben Serien wie CSI uns das Konzept von Zoom und Enhancement nahe gebracht, bevor es überhaupt existierte. Aber wenn man über die imaginäre Welt eines guten Polizisten, der gegen böse Kriminelle kämpft, hinausgeht, wird die Ethik von Technologien wie Zoom und Enhancement in der realen Welt schnell unklar.