Bildigenkänning med djupa neurala nätverk och dess användningsområden

Det handlar inte bara om att mäta varumärkeskännedom. Företag använder logotypidentifiering för att beräkna avkastningen från sponsring av sportevenemang eller för att definiera om deras logotyp har missbrukats.

Medicinsk bildanalys

Mjukvara som drivs av modeller för djupinlärning hjälper radiologer att hantera den enorma arbetsbelastning som det innebär att tolka olika medicinska bilder: datortomografi (CT) och ultraljudsundersökningar, magnetresonanstomografi (MRI) eller röntgenbilder. IBM betonar att en radiolog på en akutmottagning måste undersöka så många som 200 fall varje dag. Dessutom innehåller vissa medicinska undersökningar upp till 3 000 bilder. Det är inte konstigt att medicinska bilder står för nästan 90 procent av alla medicinska data.

AI-baserade radiologiverktyg ersätter inte kliniker utan stöder deras beslutsfattande. De flaggar för akuta avvikelser, identifierar högriskpatienter eller patienter som behöver akut behandling så att radiologerna kan prioritera sina arbetslistor.

IBM Research division i Haifa, Israel, arbetar med Cognitive Radiology Assistant för medicinsk bildanalys. Systemet analyserar medicinska bilder och kombinerar sedan denna insikt med information från patientens journal och presenterar resultat som radiologer kan ta hänsyn till när de planerar behandlingen.

Demo för IBM:s Eyes of Watson-verktyg för upptäckt av bröstcancer som använder datorseende och ML. Källa: IBM Research

Vetenskapsmän från denna division har också utvecklat ett specialiserat djupt neuralt nätverk för att flagga onormal och potentiellt cancerartad bröstvävnad.

Aidoc tillhandahåller en annan lösning som använder djupinlärning för att skanna medicinska bilder (framför allt datortomografier) och prioritera patientlistor. Lösningen har fått klartecken från den amerikanska livsmedels- och läkemedelsmyndigheten (FDA), Therapeutic Goods of Australia (TGA) och EU:s CE-märkning för att flagga tre livshotande tillstånd: lungemboli, fraktur på halsryggraden och intrakraniell blödning.

Företagets kunder är bland annat UMass Memorial Medical Center i Worcester, Massachusetts, Montefiore Nyack Hospital i Rockland County, NY, och Global Diagnostics Australia, ett centrum för bilddiagnostik.

Appar för att känna igen konstverk

Magnus är en bildigenkänningsdriven app som guidar konstälskare och samlare “genom konstdjungeln”. När en användare tar ett foto av ett konstverk ger appen detaljer som författare, titel, skapelseår, mått, material och, viktigast av allt, aktuellt och historiskt pris. Appen har också en karta med gallerier, museer och auktioner samt aktuella konstverk.

Magnus hämtar information från en databas med över 10 miljoner bilder av konstverk; information om verk och priser är crowdsourcad. Intressant faktum: Leonardo DiCaprio investerade i appen, säger Magnus på sin Apple Store-sida.

Museibesökare kan tillfredsställa sin hunger efter kunskap med appar som Smartify. Smartify är en museiguide som du kan använda på dussintals av världens välkända konstställen som Metropolitan Museum of Art i New York, Smithsonian National Portrait Gallery i Washington DC, Louvren i Paris, Rijksmuseum i Amsterdam, Royal Academy of Arts i London, State Hermitage Museum i Sankt Petersburg och andra.

Hur Smartify fungerar. Källa: Smartify

För att avslöja detaljer om ett konstverk matchar appen skannade konstverk mot digitala bilder i en databas, som innehöll nästan 50 000 konstverk 2017. Smartify medgrundare Anna Lowe förklarar hur appen fungerar på detta sätt: “Vi skannar konstverk med hjälp av foton eller digitala bilder och skapar sedan digitala fingeravtryck av konstverket, vilket innebär att det reduceras till en uppsättning digitala punkter och linjer.”

Ansiktsigenkänning för att förbättra upplevelsen på flygplatser

Ansiktsigenkänning håller på att bli vanlig bland flygbolagen som använder den för att förbättra ombordstigning och incheckning. Det finns två huvudriktningar för dessa uppgraderingar: att följa trenderna för självbetjäning och denna biometriska teknik och göra flygplatsupplevelsen säkrare och snabbare. Ju färre steg både passagerare och personal måste ta för att kunna fortsätta med rutinerna före flygning, desto bättre.

Boardingutrustning skannar resenärernas ansikten och matchar dem med foton som lagras i gränskontrollmyndigheternas databaser (t.ex. U.S. Customs and Border Protection) för att verifiera deras identitet och flygdata. Det kan vara foton från ID-kort, visum eller andra dokument.

American Airlines har till exempel börjat använda ansiktsigenkänning vid gaten för ombordstigning i terminal D på Dallas/Fort Worth International Airport i Texas. I stället för att använda boardingkort får resenärerna sitt ansikte skannat. Det enda som inte har förändrats är att man fortfarande måste ha ett pass och en biljett för att gå igenom en säkerhetskontroll. Biometrisk ombordstigning fungerar på en opt-in-basis.

Biometrisk ombordstigning för American Airlines passagerare. Källa: The Dallas Morning News

Under 2018 testade American biometri i 90 dagar på Los Angeles International Airport Terminal 4 med tanken att utöka användningen av tekniken om försöket går bra.

Flera flygbolag implementerar också ansiktsigenkänning som ett extra boardingalternativ: JetBlue, British Airways, AirAsia, Lufthansa eller Delta. Den sistnämnda installerade en självbetjäning för bagageutlämning på Minneapolis-St. Paul International Airport 2017.

Visuell produktsökning

Gränserna mellan online- och offline-shopping har försvunnit sedan visuell sökning kom in i leken. Urban Outfitters-appen har till exempel en Scan + Shop-funktion, tack vare vilken konsumenterna kan skanna en vara som de hittar i en fysisk butik eller tryckt i en tidning, få en detaljerad beskrivning och omedelbart beställa den. Visuell sökning förbättrar också shoppingupplevelsen online.

Appar med denna funktion drivs av neurala nätverk. NN:er bearbetar bilder som laddas upp av användare och genererar bildbeskrivningar (taggar), t.ex. plaggtyp, tyg, stil, färg. Bildbeskrivningarna matchas mot varor som finns i lager tillsammans med motsvarande taggar. Sökresultaten presenteras baserat på en likhetspoäng.

Vi har ägnat ett avsnitt åt visuell sökning i artikeln om hur detaljhandlare använder AI. Där kan du också läsa om hur teknik för bild- och ansiktsigenkänning har gjort kassalösa butiker som Amazon Go till verklighet och även hur de driver övervakningssystem eller möjliggör personalisering i butik.

Arbetet fortsätter

Under den andra delen av 1900-talet uppskattade forskarna att det skulle ta relativt kort tid att lösa bland annat ett datorseendeproblem. År 1966 samordnade matematikern och tidigare meddirektören för MIT Computer Science & AI Lab Seymour Papert Summer Vision Project. Forskarna hade en ambitiös plan: att under en sommar bygga en betydande del av ett system med datorseendefunktioner, så som vi känner till dem i dag. “Projektets främsta mål är att konstruera ett system av program som delar upp en vidisektorbild i regioner såsom sannolika objekt, sannolika bakgrundsområden och kaos”, stod det i projektbeskrivningen.

Ja, det tog mycket längre tid. Modern programvara kan känna igen ett stort antal vardagliga föremål, mänskliga ansikten, tryckt och handskriven text i bilder och andra enheter (se vår artikel om API:er för bildigenkänning.) Men arbetet fortsätter och vi kommer att fortsätta att bevittna hur allt fler företag och organisationer implementerar bildigenkänning och andra datorseendeuppgifter för att sticka ut från konkurrenterna och optimera verksamheten.

Lämna ett svar

Din e-postadress kommer inte publiceras.