Rozpoznávání obrazu pomocí hlubokých neuronových sítí a jeho využití

Nejde jen o měření povědomí o značce. Firmy používají rozpoznávání loga k výpočtu návratnosti investic ze sponzorování sportovních akcí nebo k určení, zda jejich logo nebylo zneužito.

Medicínská analýza obrazu
Aplikace pro rozpoznávání uměleckých děl
Rozpoznávání obličeje ke zlepšení zážitku na letišti
Vizuální vyhledávání produktů
Práce pokračuje

Medicínská analýza obrazu

Software využívající modely hlubokého učení pomáhá radiologům zvládat obrovskou zátěž při interpretaci různých lékařských snímků: počítačové tomografie (CT) a ultrazvukových snímků, magnetické rezonance (MRI) nebo rentgenových snímků. IBM zdůrazňuje, že radiolog na pohotovosti musí každý den vyšetřit až 200 případů. Kromě toho některé lékařské studie obsahují až 3 000 snímků. Není divu, že lékařské snímky tvoří téměř 90 % všech lékařských dat.

Radiologické nástroje založené na umělé inteligenci nenahrazují lékaře, ale podporují jejich rozhodování. Označují akutní abnormality, identifikují rizikové pacienty nebo pacienty vyžadující urgentní ošetření, takže radiologové mohou upřednostnit své pracovní seznamy.

Výzkumná divize IBM v izraelské Haifě pracuje na kognitivním radiologickém asistentovi pro analýzu lékařských snímků. Systém analyzuje lékařské snímky a následně kombinuje tyto poznatky s informacemi z lékařských záznamů pacienta a předkládá zjištění, která mohou radiologové zohlednit při plánování léčby.

Demo k nástroji IBM Eyes of Watson pro detekci rakoviny prsu, který využívá počítačové vidění a ML. Zdroj: MZd ČR, MZd ČR, MZd ČR, MZd ČR:

Vědci z této divize také vyvinuli specializovanou hlubokou neuronovou síť, která označuje abnormální a potenciálně rakovinovou tkáň prsu.

Aidoc nabízí další řešení, které využívá hluboké učení pro skenování lékařských snímků (zejména CT snímků) a stanovení prioritních seznamů pacientů. Toto řešení získalo povolení od amerického Úřadu pro kontrolu potravin a léčiv (FDA), australské organizace Therapeutic Goods of Australia (TGA) a označení CE Evropské unie pro označování tří život ohrožujících stavů: plicní embolie, zlomeniny krční páteře a nitrolebního krvácení.

Mezi klienty společnosti patří UMass Memorial Medical Center ve Worcesteru ve státě Massachusetts, nemocnice Montefiore Nyack v Rockland County v New Yorku a zobrazovací centrum Global Diagnostics Australia.

Aplikace pro rozpoznávání uměleckých děl

Magnus je aplikace poháněná rozpoznáváním obrazu, která milovníky a sběratele umění provede “džunglí umění”. Jakmile uživatel vyfotografuje umělecké dílo, aplikace mu poskytne takové údaje, jako je autor, název, rok vzniku, rozměry, materiál a především aktuální a historická cena. Aplikace má také mapu s galeriemi, muzei a aukcemi a aktuálně vystavenými uměleckými díly.

Magnus čerpá informace z databáze více než 10 milionů obrázků uměleckých děl; informace o dílech a cenách jsou získávány crowdsourcingem. Zajímavost: Do aplikace investoval Leonardo DiCaprio, uvádí Magnus na své stránce v Apple Store.

Hlad po znalostech mohou návštěvníci muzeí ukojit pomocí aplikací, jako je Smartify. Smartify je muzejní průvodce, kterého můžete používat v desítkách známých světových uměleckých míst, jako je Metropolitní muzeum v New Yorku, Smithsonova národní portrétní galerie ve Washingtonu, pařížský Louvre, amsterdamské Rijksmuseum, Královská akademie umění v Londýně, Státní Ermitáž v Petrohradě a další.

Jak Smartify funguje. Zdroj: ČTK, s.r.o: Smartify

Pro odhalení podrobností o uměleckém díle aplikace porovnává naskenovaná umělecká díla s digitálními obrazy v databázi, která v roce 2017 obsahovala téměř 50 000 uměleckých děl. Spoluzakladatelka společnosti Smartify Anna Lowe vysvětluje, jak aplikace takto funguje: “

Rozpoznávání obličeje ke zlepšení zážitku na letišti

Rozpoznávání obličeje se dostává do popředí zájmu leteckých společností, které ho používají ke zlepšení nástupu na palubu a odbavení. Tyto modernizace mají dva hlavní směry: sledovat trendy samoobsluhy a této biometrické technologie a zvýšit bezpečnost a zrychlit odbavení na letišti. Čím méně kroků musí cestující i personál učinit, aby mohli pokračovat v předletových rutinních úkonech, tím lépe.

Zařízení pro odbavení skenuje obličeje cestujících a porovnává je s fotografiemi uloženými v databázích orgánů hraniční kontroly (tj. Celní a pohraniční ochrany USA), aby ověřilo jejich totožnost a údaje o letu. Může jít o fotografie z občanských průkazů, víz nebo jiných dokladů.

American Airlines například začala používat rozpoznávání obličejů u nástupních bran terminálu D na mezinárodním letišti Dallas/Fort Worth v Texasu. Místo palubních vstupenek se cestujícím skenuje obličej. Jediné, co se nezměnilo, je, že člověk musí mít stále pas a letenku, aby mohl projít bezpečnostní kontrolou. Biometrický nástup do letadla funguje na principu opt-in.

Biometrický nástup do letadla pro cestující společnosti American Airlines. Zdroj: MZV ČR Zdroj: MZV ČR Zdroj: MZV ČR Zdroj: MZV ČR

V roce 2018 testovala společnost American po dobu 90 dnů biometrii na terminálu 4 mezinárodního letiště v Los Angeles s tím, že pokud testování dopadne dobře, rozšíří využití technologie.

Rozpoznávání obličeje jako další možnost nástupu do letadla zavádí také řada leteckých společností: JetBlue, British Airways, AirAsia, Lufthansa nebo Delta. Poslední z nich v roce 2017 nainstalovala samoobslužný odbavovací systém na mezinárodním letišti Minneapolis-St. Paul.

Vizuální vyhledávání produktů

Od doby, kdy do hry vstoupilo vizuální vyhledávání, zmizely hranice mezi online a offline nakupováním. Například aplikace Urban Outfitters má funkci Scan + Shop, díky níž mohou zákazníci naskenovat zboží, které najdou v kamenném obchodě nebo je otištěno v časopise, získat jeho podrobný popis a okamžitě ho objednat. Vizuální vyhledávání také zlepšuje zážitek z nakupování online.

Aplikace s touto funkcí jsou poháněny neuronovými sítěmi. NN zpracovávají obrázky nahrané uživateli a generují popisy obrázků (tagy), například typ oděvu, látku, styl, barvu. Popisy obrázků jsou porovnávány s položkami na skladě spolu s odpovídajícími tagy. Výsledky vyhledávání jsou prezentovány na základě skóre podobnosti.

Vizuálnímu vyhledávání jsme věnovali část článku o tom, jak prodejci využívají umělou inteligenci. Dočtete se tam také o tom, jak technologie rozpoznávání obrazu a obličeje proměnily v realitu obchody bez pokladen, jako je Amazon Go, a také o tom, jak pohánějí dohledové systémy nebo umožňují personalizaci v obchodech.

Práce pokračuje

V druhé polovině 20. století vědci odhadovali, že vyřešení problému počítačového vidění zabere mimo jiné relativně krátkou dobu. V roce 1966 koordinoval matematik a bývalý spoluředitel počítačové laboratoře MIT & AI Lab Seymour Papert projekt Summer Vision. Výzkumníci měli ambiciózní plán: během jednoho léta vytvořit významnou část systému se schopnostmi počítačového vidění, jak je známe dnes. “Hlavním cílem projektu je zkonstruovat systém programů, které rozdělí obraz z videodetekce na oblasti, jako jsou pravděpodobné objekty, pravděpodobné oblasti pozadí a chaos,” stálo v popisu projektu.

No, trvalo to mnohem déle. Moderní software dokáže rozpoznat velké množství každodenních objektů, lidských tváří, tištěného a ručně psaného textu na obrázcích a dalších entit (podívejte se na náš článek o API pro rozpoznávání obrazu.) Práce však pokračuje a my budeme i nadále svědky toho, jak stále více podniků a organizací implementuje rozpoznávání obrazu a další úlohy počítačového vidění, aby se odlišily od konkurence a optimalizovaly provoz.

Maternidad y todo