És a felügyeleti következményei ijesztőek
A jelenetet mindannyian ismerjük. Két nyomozó egy rendőrségi műsorban áll egy monitorokkal teli, gyengén megvilágított szobában, és a biztonsági felvételeket nézik át. Egy technikus (igen, szinte mindig egy férfi) képet kép után sorba állít, miközben a nyomozók koncentráltan hunyorogva nézik a képernyőt. “Nincs itt semmi!” – erősködik az egyik nyomozó. Már éppen feladnák, amikor a másik nyomozó (a hősünk) azt kiáltja: “Várj!”
Mindenki megáll. “Közelítsetek oda!” – mondja a nyomozó. A technikus kötelességtudóan ráközelít a kép egy szemcsés sarkára. “Nagyítsd fel!” – intonálja a nyomozó. A technikus megérint néhány billentyűt, motyog valamit az algoritmusokról, és hirtelen a kép fókuszba kerül, felfedve néhány apró, jelentős részletet. Az ügy meg van oldva!
Ez a jelenet olyannyira elterjedt krimi-klisé, hogy saját, közel egymilliós nézettségű mémvideót ihletett.
Az ehhez hasonló jelenetek az igazi technikusokat az őrületbe kergetik, mert a “nagyítás és nagyítás” mindig is lehetetlen fantáziának tűnt. Egészen mostanáig. Két közelmúltbeli újításnak köszönhetően a zoom and enhance végre itt van. Lehetősége van arra, hogy gyökeresen megváltoztassa a rendőrségi felügyeletet, sokszor érintő módon – vagy legalábbis segíthet visszahozni a ’00-as évek eleji fotóit.
A valós életbeli zoom és fokozás mögött álló első innováció a fotózás világából származik. A közelmúltig a fotósoknak két elsődleges lehetőségük volt a digitális fényképezőgépek terén: professzionális DSLR fényképezőgépek, mint a Nikon D sorozat, vagy olcsó kompakt fogyasztói fényképezőgépek, mint amilyeneket születésnapi vagy utazási pillanatképekhez használunk. A DSLR-k nagyszerű fényképeket készítenek, de terjedelmesek és feltűnőek, és nehéz lehet őket kezelni – nem túl jó kombináció a felügyeleti munkához. A kompakt fényképezőgépek ritkán rendelkeznek a megfigyeléssel foglalkozó szakemberek számára szükséges minőséggel.
Mindez 2015 körül kezdett megváltozni a tükör nélküli fényképezőgépek megjelenésével. Ezek a fényképezőgépek a kompakt fényképezőgépek apró formai tényezőjével rendelkeznek, de a képalkotó chipek fejlődésének köszönhetően, amelyet részben az okostelefonok vezéreltek, ugyanolyan kiváló minőségű képérzékelőket tartalmaznak, mint amilyenek általában a DSLR fényképezőgépekben találhatók. Egyre több komplex képfeldolgozó szoftvert is kölcsönöznek az okostelefonok világából, ami tovább növeli képességeiket. És ami döntő fontosságú, lehetővé teszik a professzionális objektívek használatát – ami könnyen a legfontosabb tényező a kiváló minőségű fényképek készítéséhez.
Néhány ezer dollárért egy megfigyeléssel foglalkozó szakember vagy a rendőrség ma már olyan apró, könnyen kezelhető kamerákat vásárolhat, amelyek jobb fényképeket készítenek, mint a legjobb, néhány évvel ezelőtti professzionális kamerák.
A végeredmény egy olyan apró kamera, amelyet észrevétlenül lehet hordozni és használni, miközben rendkívül részletes, nagy felbontású fényképeket készít. A Q, a legendás német fényképezőgépgyártó Leica tükör nélküli fényképezőgépe nagyrészt elindította ezt a trendet. A legújabb Q modell mindössze 1,4 kilót nyom, és 47 megapixeles fotókat készít egy obszcénul éles lencsén keresztül, amely több részletet lát, mint az emberi szem. Az 50 000-es ISO-értékkel (15-ször magasabb, mint amit a leggyorsabb analóg filmek elérnek) lényegében sötétben is lát.
Azóta megjelentek az olcsóbb konkurensek, például a Sony Alpha. Néhány ezer dollárért ma már egy megfigyeléssel foglalkozó szakember vagy a rendőrség olyan apró, könnyen kezelhető kamerákat vásárolhat, amelyek jobb képeket készítenek, mint a néhány évvel ezelőtti legjobb professzionális kamerák. Az ilyen kamerákkal készített fényképek nagyítása néha olyan érzés lehet, mintha a zoomot és a nagyítást használnánk. Az általuk rögzített részletek – különösen modern szoftverekkel párosítva – figyelemre méltóak.
De ha a tükör nélküli fényképezőgépek képeit tömörítő érzékeléssel kombináljuk, akkor a zoomolás és a nagyítás valóban itt van. A tömörítő érzékelés lehetővé teszi, hogy masszívan felnagyítson egy képet anélkül, hogy a minőség jelentősen romlana. A technológia a 2000-es évek eleje óta létezik, de 2010-ben vált ismertté, amikor kutatók bemutatták, hogyan lehet vele rekonstruálni Barack Obama elnök képét egy apró, véletlenszerűen elosztott pixelekből álló minta segítségével.
2017-ben a Google bemutatta, hogyan lehet a kompresszív érzékelés elveit neurális hálózatokkal kombinálni a leromlott vagy rossz minőségű képek rekonstruálásához az A.I. super-resolution nevű eljárás során. A technológia úgy működik, hogy mintaképekkel – gyakran arcokról vagy szobákról készült képekkel – kezdünk, és szándékosan elrontjuk őket, például homályossá tesszük őket, átfuttatjuk őket egy szörnyű JPEG tömörítési rendszeren és hasonlókon.
A neurális hálózat ezután megnézi a romlott képeket, összehasonlítja őket a jó minőségű társaikkal, és megtanulja, hogyan viszonyul egymáshoz a kettő. Lényegében a hálózat megtanulja magának az összes módot, ahogyan egy digitális kép romolhat. Miután ezt megismerte, a folyamat megfordul. A rendszer kap egy rossz minőségű vagy romlott képet, és a betanítás alapján a semmiből felépít egy jó minőségű, nem romlott változatot.
Bár a Google azóta nagyrészt kivonult a területről, az M.I. szuperfelbontás beindult. Az olyan szolgáltatások, mint a Big JPG, lehetővé teszik a felhasználók számára, hogy feltöltsenek egy rossz minőségű fényképet, és azt azonnal 400%-kal vagy még többel felskálázzák, gyakran minimális minőségromlással. A Photoshop bővítményei hasonló technológiát biztosítottak a fotósok számára, akik az elmosódottság eltávolítására és a képek élesítésére használják. Az én M.I.-vezérelt fotós cégem gyakran használja a technológiát a 2000-es évek elején készült digitális fényképezőgépes fotók felskálázására, így még ezek a gyenge minőségű korai képek is megfelelnek a mai szabványoknak a kiadványokban való felhasználáshoz.
A technológiát azonban megfigyelésre is használják. A kutatók a kifejlesztése után hamarosan elkezdték bemutatni, hogyan lehet a szuperfelbontást alacsony felbontású megfigyelési fotók vagy megfigyelési videók képkockáinak feljavítására használni. Mások a technológia célzott alkalmazására összpontosítottak, például a rendszámtábla-felismerésre. Számos csoport pedig az arcfelismerő képek szuperfelbontására összpontosított, egészen odáig, hogy speciális algoritmusokat fejlesztettek ki az arcképek feljavítására.
Már több gyártó is integrálta ezeket az algoritmusokat dedikált szoftvertermékekbe. Tapasztalataim szerint a Topaz Labs a legfejlettebb. Párosítsa Gigapixel AI termékét egy modern tükör nélküli fényképezőgép kimenetével, és olyan zoomot és javítást kap, amely vetekszik az olyan műsorok elképzelt rendszereivel, mint a CSI.
Itt van például egy fénykép a kaliforniai Marin megyében található Jamba Juice étteremről, amelyet a Leica Q tükör nélküli fényképezőgépemmel készítettem.
Ezt az utca túloldaláról készítettem, a tenyérnyi fényképezőgéppel a nyakamban. Ezután lefuttattam a képet a Topaz Gigapixel AI szoftverén, 400%-kal felskáláztam, és a cég saját arcrekonstrukciós és élesítő algoritmusait használtam.
A feljavított képet teljes méretre nagyítva hihetetlen részleteket láthatunk. Az étterem bejárati ablakán keresztül jól látható egy vendég, aki sorban áll és az étlapot vizsgálja.