Recunoașterea imaginilor cu ajutorul rețelelor neuronale profunde și cazurile sale de utilizare

Nu este vorba doar de măsurarea notorietății mărcii. Întreprinderile folosesc detectarea logo-ului pentru a calcula ROI din sponsorizarea evenimentelor sportive sau pentru a defini dacă logo-ul lor a fost folosit în mod abuziv.

Analiză de imagini medicale

Software-ul alimentat de modele de învățare profundă îi ajută pe radiologi să facă față volumului uriaș de muncă pe care îl presupune interpretarea diferitelor imagini medicale: tomografie computerizată (CT) și ecografii cu ultrasunete, imagistică prin rezonanță magnetică (RMN) sau radiografii. IBM subliniază că un radiolog de urgență trebuie să examineze până la 200 de cazuri în fiecare zi. În plus, unele studii medicale conțin până la 3.000 de imagini. Nu este de mirare că imaginile medicale reprezintă aproape 90 la sută din toate datele medicale.

Instrumentele de radiologie bazate pe IA nu înlocuiesc clinicienii, ci îi sprijină în luarea deciziilor. Ele semnalează anomalii acute, identifică pacienții cu risc ridicat sau pe cei care au nevoie de tratament urgent, astfel încât radiologii își pot prioritiza listele de lucru.

Divizia de cercetare IBM din Haifa, Israel, lucrează la Cognitive Radiology Assistant pentru analiza imaginilor medicale. Sistemul analizează imaginile medicale și apoi combină această perspectivă cu informații din dosarele medicale ale pacientului și prezintă constatări pe care radiologii le pot lua în considerare atunci când planifică tratamentul.

Demo pentru instrumentul de detectare a cancerului de sân Eyes of Watson de la IBM, care folosește viziunea computerizată și ML. Sursa: IBM Research

Cercetătorii din această divizie au dezvoltat, de asemenea, o rețea neuronală profundă specializată pentru a semnala țesutul mamar anormal și potențial canceros.

Aidoc oferă o altă soluție care utilizează învățarea profundă pentru scanarea imaginilor medicale (în special scanări CT) și prioritizarea listelor de pacienți. Soluția a primit autorizații din partea US Food and Drug Administration (FDA), Therapeutic Goods of Australia (TGA) și marcajul CE al Uniunii Europene pentru semnalarea a trei afecțiuni care pun în pericol viața: embolie pulmonară, fractură de coloană cervicală și hemoragie intracraniană.

Clienții companiei includ UMass Memorial Medical Center din Worcester, Massachusetts, Montefiore Nyack Hospital din Rockland County, NY, și Global Diagnostics Australia, un centru de imagistică.

Aplicații pentru recunoașterea operelor de artă

Magnus este o aplicație alimentată de recunoașterea imaginilor care ghidează iubitorii și colecționarii de artă “prin jungla artei”. Odată ce un utilizator fotografiază o operă de artă, aplicația oferă detalii precum autorul, titlul, anul de creație, dimensiunile, materialul și, cel mai important, prețul actual și istoric. Aplicația are, de asemenea, o hartă cu galerii, muzee și licitații, precum și cu operele de artă expuse în prezent.

Magnus își extrage informațiile dintr-o bază de date cu peste 10 milioane de imagini de opere de artă; informațiile despre piese și prețuri sunt obținute prin crowdsourcing. Fapt interesant: Leonardo DiCaprio a investit în aplicație, precizează Magnus pe pagina sa din Apple Store.

Muzeografii își pot satisface foamea de cunoaștere cu aplicații precum Smartify. Smartify este un ghid de muzeu pe care îl puteți folosi în zeci de locuri de artă bine cunoscute din lume, cum ar fi Metropolitan Museum of Art din New York, Smithsonian National Portrait Gallery din Washington DC, Louvre din Paris, Rijksmuseum din Amsterdam, Royal Academy of Arts din Londra, The State Hermitage Museum din Sankt Petersburg și altele.

Cum funcționează Smartify. Sursa: Smartify

Pentru a dezvălui detalii despre o operă de artă, aplicația potrivește operele de artă scanate cu imaginile digitale dintr-o bază de date, care conținea aproape 50.000 de opere de artă în 2017. Cofondatoarea Smartify, Anna Lowe, explică modul în care funcționează aplicația în acest fel: “Scanăm operele de artă folosind fotografii sau imagini digitale și apoi creăm amprente digitale ale operei de artă, ceea ce înseamnă că aceasta este redusă la un set de puncte și linii digitale.”

Recunoașterea facială pentru a îmbunătăți experiența în aeroporturi

Recunoașterea facială devine o practică curentă în rândul companiilor aeriene care o folosesc pentru a îmbunătăți îmbarcarea și înregistrarea. Există două direcții principale ale acestor modernizări: să urmeze tendințele pentru autoservire și această tehnologie biometrică și să facă experiența aeroportuară mai sigură și mai rapidă. Cu cât mai puțini pași trebuie să facă atât pasagerii, cât și personalul pentru a continua cu rutina dinaintea zborului, cu atât mai bine.

Echipamentul de îmbarcare scanează fețele călătorilor și le potrivește cu fotografiile stocate în bazele de date ale agențiilor de control la frontieră (de exemplu, Serviciul Vamal și de Protecție a Frontierelor din SUA) pentru a le verifica identitatea și datele de zbor. Acestea ar putea fi fotografii din acte de identitate, vize sau alte documente.

American Airlines, de exemplu, a început să utilizeze recunoașterea facială la porțile de îmbarcare din Terminalul D al Aeroportului Internațional Dallas/Fort Worth, Texas. În loc să folosească cărțile de îmbarcare, călătorilor li se scanează fața. Singurul lucru care nu s-a schimbat este că trebuie să ai în continuare un pașaport și un bilet pentru a trece printr-un control de securitate. Îmbarcarea biometrică funcționează pe baza unei opțiuni.

Îmbarcarea biometrică pentru pasagerii American Airlines. Sursa: The Dallas Morning News

În 2018, American a testat biometria timp de 90 de zile la Terminalul 4 al Aeroportului Internațional din Los Angeles, în ideea de a extinde utilizarea tehnologiei dacă testul va decurge bine.

Numeroase companii aeriene implementează recunoașterea facială ca o opțiune suplimentară de îmbarcare, de asemenea: JetBlue, British Airways, AirAsia, Lufthansa sau Delta. Ultima a instalat un sistem de auto-servire a bagajelor la Aeroportul Internațional Minneapolis-St. Paul în 2017.

Cercetarea vizuală a produselor

Limitele dintre cumpărăturile online și offline au dispărut de când căutarea vizuală a intrat în joc. De exemplu, aplicația Urban Outfitters are o funcție Scan + Shop, datorită căreia consumatorii pot scana un articol pe care îl găsesc într-un magazin fizic sau tipărit într-o revistă, pot obține o descriere detaliată a acestuia și îl pot comanda instantaneu. Căutarea vizuală îmbunătățește, de asemenea, experiența de cumpărături online.

Aplicațiile cu această capacitate sunt alimentate de rețele neuronale. NN-urile procesează imaginile încărcate de utilizatori și generează descrieri ale imaginilor (tag-uri), de exemplu, tipul de îmbrăcăminte, materialul, stilul, culoarea. Descrierile imaginilor sunt comparate cu articolele din stoc împreună cu etichetele corespunzătoare. Rezultatele căutării sunt prezentate pe baza unui scor de similaritate.

Am dedicat o secțiune despre căutarea vizuală în articolul despre modul în care comercianții cu amănuntul utilizează IA. Acolo puteți citi, de asemenea, despre modul în care tehnologiile de recunoaștere a imaginii și a feței au transformat magazinele fără casierie, cum ar fi Amazon Go, într-o realitate și, de asemenea, despre modul în care acestea alimentează sistemele de supraveghere sau permit personalizarea în magazin.

Lucrările continuă

În a doua parte a secolului al XX-lea, cercetătorii au estimat că ar fi nevoie de un timp relativ scurt pentru a rezolva o problemă de viziune pe calculator, printre altele. În 1966, matematicianul și fostul co-director al laboratorului de inteligență artificială & al MIT Computer Science & Seymour Papert coordona proiectul Summer Vision Project. Cercetătorii aveau un plan ambițios: să construiască o parte semnificativă a unui sistem cu capacități de viziune pe calculator, așa cum le cunoaștem astăzi, pe parcursul unei veri. “Scopul principal al proiectului este de a construi un sistem de programe care să împartă o imagine vidisectoare în regiuni precum obiecte probabile, zone probabile de fundal și haos”, se spunea în descrierea proiectului.

Ei bine, a durat mult mai mult. Software-ul modern poate recunoaște un număr mare de obiecte de zi cu zi, fețe umane, text tipărit și scris de mână în imagini și alte entități (consultați articolul nostru despre API-urile de recunoaștere a imaginilor.) Dar munca continuă și vom continua să asistăm la modul în care tot mai multe întreprinderi și organizații implementează recunoașterea imaginilor și alte sarcini de viziune computerizată pentru a se distinge de concurenți și pentru a optimiza operațiunile.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.