Billedgenkendelse med dybe neurale netværk og dets anvendelsestilfælde

Det handler ikke kun om at måle brand awareness. Virksomheder bruger logo-genkendelse til at beregne ROI fra sponsorering af sportsbegivenheder eller til at definere, om deres logo er blevet misbrugt.

Medicinsk billedanalyse

Software drevet af deep learning-modeller hjælper radiologer med at håndtere en enorm arbejdsbyrde i forbindelse med fortolkning af forskellige medicinske billeder: computertomografi (CT) og ultralydsscanninger, magnetisk resonansbilleddannelse (MRI) eller røntgenbilleder. IBM understreger, at en radiolog på en skadestue skal undersøge op til 200 tilfælde hver dag. Desuden indeholder nogle medicinske undersøgelser op til 3.000 billeder. Det er ikke underligt, at medicinske billeder udgør næsten 90 procent af alle medicinske data.

AI-baserede radiologiværktøjer erstatter ikke klinikere, men understøtter deres beslutningstagning. De markerer akutte abnormiteter, identificerer højrisikopatienter eller patienter, der har brug for akut behandling, så radiologerne kan prioritere deres arbejdslister.

IBM Research Division i Haifa, Israel, arbejder på Cognitive Radiology Assistant til medicinsk billedanalyse. Systemet analyserer medicinske billeder og kombinerer derefter denne indsigt med oplysninger fra patientens journaler og præsenterer resultater, som radiologer kan tage hensyn til, når de planlægger behandlingen.

Demo for IBM’s Eyes of Watson-værktøj til brystkræftdetektion, der anvender computervision og ML. Kilde: IBM Research

Videnskabsfolk fra denne afdeling har også udviklet et specialiseret dybt neuralnetværk til at markere unormalt og potentielt kræftvæv i brystet.

Aidoc tilbyder en anden løsning, der anvender deep learning til scanning af medicinske billeder (især CT-scanninger) og prioritering af patientlister. Løsningen har fået godkendelser fra den amerikanske Food and Drug Administration (FDA), Therapeutic Goods of Australia (TGA) og EU’s CE-mærkning til markering af tre livstruende tilstande: lungeemboli, brud på halshvirvelsøjlen og intrakranielle blødninger.

Selskabets kunder omfatter UMass Memorial Medical Center i Worcester, Massachusetts, Montefiore Nyack Hospital i Rockland County, NY, og Global Diagnostics Australia, et billeddiagnostisk center.

Apps til genkendelse af kunstværker

Magnus er en app med billedgenkendelse, der guider kunstelskere og samlere “gennem kunstjunglen”. Når en bruger tager et foto af et kunstværk, giver appen oplysninger som forfatter, titel, skabelsesår, dimensioner, materiale og, vigtigst af alt, den nuværende og historiske pris. Appen har også et kort med gallerier, museer og auktioner samt de aktuelt udstillede kunstværker.

Magnus henter oplysninger fra en database med over 10 millioner billeder af kunstværker; oplysninger om værker og priser er crowdsourcet. Interessant faktum: Leonardo DiCaprio har investeret i appen, oplyser Magnus på sin Apple Store-side.

Museumsgæster kan tilfredsstille deres videnshunger med apps som Smartify. Smartify er en museumsguide, som du kan bruge på snesevis af verdens kendte kunststeder som The Metropolitan Museum of Art i New York, Smithsonian National Portrait Gallery i Washington DC, Louvre i Paris, Rijksmuseum i Amsterdam, Royal Academy of Arts i London, The State Hermitage Museum i Sankt Petersborg og andre.

Sådan fungerer Smartify. Kilde: Smartify

For at afsløre detaljer om et kunstværk matcher appen scannede kunstværker med digitale billeder i en database, som indeholdt næsten 50.000 kunstværker i 2017. Smartify-medstifter Anna Lowe forklarer, hvordan appen fungerer på denne måde: “Vi scanner kunstværker ved hjælp af fotos eller digitale billeder og skaber derefter digitale fingeraftryk af kunstværket, hvilket betyder, at det reduceres til et sæt digitale prikker og linjer.”

Gesynsgenkendelse skal forbedre oplevelsen i lufthavne

Gesynsgenkendelse er ved at blive mainstream blandt flyselskaber, der bruger det til at forbedre boarding og check-in. Der er to hovedretninger for disse opgraderinger: at følge tendenserne for selvbetjening og denne biometriske teknologi og gøre lufthavnsoplevelsen mere sikker og hurtigere. Jo færre skridt både passagerer og personale skal tage for at fortsætte med rutinerne før flyvningen, jo bedre.

Bordingudstyr scanner de rejsendes ansigter og sammenligner dem med fotos, der er lagret i grænsekontrolmyndighedernes databaser (dvs. U.S. Customs and Border Protection), for at bekræfte deres identitet og flydata. Det kan være fotos fra ID-kort, visa eller andre dokumenter.

American Airlines er f.eks. begyndt at anvende ansigtsgenkendelse ved boarding-gates i Terminal D i Dallas/Fort Worth International Airport i Texas. I stedet for at bruge boardingkort får de rejsende scannet deres ansigt. Det eneste, der ikke er ændret, er, at man stadig skal have et pas og en billet for at gå gennem sikkerhedskontrollen. Biometrisk boarding fungerer på et opt-in-grundlag.

Biometrisk boarding for American Airlines-passagerer. Kilde: The Dallas Morning News

I 2018 testede American biometri i 90 dage i Terminal 4 i Los Angeles International Airport Terminal 4 med tanken om at udvide brugen af teknologien, hvis forsøget går godt.

En lang række flyselskaber implementerer også ansigtsgenkendelse som en ekstra boardingmulighed: JetBlue, British Airways, AirAsia, Lufthansa eller Delta. Sidstnævnte installerede en selvbetjent taskeudlevering i Minneapolis-St. Paul International Airport i 2017.

Visuel produktsøgning

Grænserne mellem online- og offline-shopping er forsvundet, siden visuel søgning kom ind i spillet. Urban Outfitters-appen har f.eks. en Scan + Shop-funktion, takket være hvilken forbrugerne kan scanne en vare, de finder i en fysisk butik eller trykt i et magasin, få en detaljeret beskrivelse af den og straks bestille den. Visuel søgning forbedrer også online-shoppingoplevelsen.

Apps med denne funktion er drevet af neurale netværk. NN’er behandler billeder, der er uploadet af brugerne, og genererer billedbeskrivelser (tags), f.eks. tøjtype, stof, stil, farve. Billedbeskrivelserne sammenlignes med de varer, der er på lager, sammen med de tilsvarende tags. Søgeresultaterne præsenteres på baggrund af en lighedsscore.

Vi dedikerede et afsnit om visuel søgning i artiklen om, hvordan detailhandlere bruger kunstig intelligens. Der kan du også læse om, hvordan billed- og ansigtsgenkendelsesteknologier har gjort kasseløse butikker som Amazon Go til en realitet, og også hvordan de driver overvågningssystemer eller muliggør personalisering i butikkerne.

Arbejdet fortsætter

I anden halvdel af det 20. århundrede vurderede forskere, at det ville tage relativt kort tid at løse bl.a. et computer vision-problem. I 1966 var matematikeren og tidligere meddirektør for MIT Computer Science & AI Lab & Seymour Papert koordinator for Summer Vision Project. Forskerne havde en ambitiøs plan: at opbygge en betydelig del af et system med computer vision-funktioner, som vi kender dem i dag, i løbet af en sommer. “Det primære mål med projektet er at konstruere et system af programmer, som vil opdele et vidisektorbillede i regioner såsom sandsynlige objekter, sandsynlige baggrundsområder og kaos”, stod der i projektbeskrivelsen.

Jamen, det tog meget længere tid. Moderne software kan genkende et stort antal hverdagsgenstande, menneskelige ansigter, trykt og håndskrevet tekst i billeder og andre enheder (se vores artikel om API’er til billedgenkendelse). Men arbejdet fortsætter, og vi vil fortsat være vidne til, hvordan flere og flere virksomheder og organisationer implementerer billedgenkendelse og andre computer vision-opgaver for at skille sig ud fra konkurrenterne og optimere driften.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.