ディープニューラルネットワークによる画像認識とその活用事例

ブランド認知度の測定だけではありません。 企業は、スポーツ イベントのスポンサーになることによる ROI を計算したり、ロゴが悪用されたかどうかを定義するために、ロゴ検出を使用しています。

医療画像分析

深層学習モデルを搭載したソフトウェアは、コンピュータ断層撮影(CT)や超音波スキャン、磁気共鳴画像(MRI)やレントゲンといったさまざまな医療画像の解釈という大きな作業負荷に対して、放射線科医が対処するのを支援します。 IBMは、救急室の放射線技師は毎日200もの症例を診なければならないと強調しています。 その上、医療研究によっては3,000枚もの画像が含まれます。 医療画像がすべての医療データの 90% 近くを占めるのも不思議ではありません。

AI ベースの放射線学ツールは、臨床医に取って代わるものではなく、その意思決定をサポートするものです。 急性の異常にフラグを立て、高リスクの患者や緊急の治療が必要な患者を特定し、放射線科医がワークリストを優先できるようにします。

イスラエルのハイファにあるIBM Research部門は、医療画像分析用のCognitive Radiology Assistantに取り組んでいます。 このシステムは、医療画像を分析し、この洞察を患者の医療記録からの情報と組み合わせ、放射線技師が治療計画を立てる際に考慮できる所見を提示します。

コンピュータビジョンとMLを使用するIBMの乳がん検出ツール「Eyes of Watson」のデモ。 出典はこちら IBM Research

この部門の科学者たちは、異常で潜在的ながん性の乳房組織にフラグを立てるための、特殊なディープ ニューラル ネットワークも開発しました。

Aidocは、医療画像(特にCTスキャン)のスキャンと患者リストの優先順位付けにディープ ラーニングを使用する別のソリューションを提供しています。 このソリューションは、肺塞栓症、頸椎骨折、頭蓋内出血という3つの命に関わる状態をフラグすることで、米国食品医薬品局(FDA)、オーストラリア治療薬(TGA)、欧州連合のCEマーキングからクリアランスを得ています。

同社の顧客には、マサチューセッツ州ウースターのUMass Memorial Medical Center、ニューヨーク州ロックランド郡のMontefiore Nyack Hospital、イメージングセンターのGlobal Diagnostics Australiaなどがあります。

アート作品を認識するアプリ

Magnusは画像認識を利用したアプリで、アート愛好家やコレクターに「アートジャングルで」案内するものです。 ユーザーが美術品の写真を撮ると、作者、タイトル、制作年、寸法、素材、そして最も重要な現在および過去の価格などの詳細が表示されます。 また、ギャラリー、美術館、オークション、現在展示されている作品などの地図も表示されます。

Magnusは、1000万枚以上の美術品の画像のデータベースから情報を取得しており、作品や価格に関する情報はクラウドソーシングで提供されています。 興味深い事実: Leonardo DiCaprio がこのアプリに投資したと、Magnus の Apple Store ページで述べています。

美術館に行く人は、Smartify などのアプリで、知識欲を満たすことができます。 Smartifyは、ニューヨークのメトロポリタン美術館、ワシントンDCのスミソニアン国立肖像画美術館、パリのルーヴル美術館、アムステルダムの国立美術館、ロンドンの王立芸術院、サンクトペテルブルクの国立エルミタージュ美術館など、世界の有名なアートスポットで使える美術館ガイドです

How Smartify works. 出典 Smartify

アート作品の詳細を明らかにするために、このアプリはスキャンしたアート作品を、2017年時点で約5万点のアート作品を含むデータベースのデジタル画像と照合しています。 Smartifyの共同創設者であるAnna Loweは、アプリの仕組みをこのように説明しています。 “写真やデジタル画像を使ってアート作品をスキャンし、アート作品のデジタル指紋を作成します。”つまり、アート作品をデジタル点と線の集合に還元します。”

空港体験を改善する顔認識

顔認識は、搭乗とチェックインの強化に利用する航空会社の間で主流になりつつあります。 これらのアップグレードには、セルフサービスとこの生体認証技術のトレンドに追随することと、空港での体験をより安全かつ迅速にすることの2つの大きな方向性があります。 搭乗前のルーチンを進めるために、乗客とスタッフの両方が行うステップが少ないほどよいのです。

搭乗設備は旅行者の顔をスキャンし、国境管理機関のデータベース(すなわち、米国税関・国境警備局)に保存されている写真と照合して、身元およびフライトデータを確認します。 例えば、アメリカン航空は、テキサス州ダラス/フォートワース国際空港のターミナル D の搭乗ゲートで顔認識の使用を開始しました。 搭乗券を使う代わりに、旅行者は顔をスキャンされるのです。 ただ、セキュリティチェックを受けるには、パスポートと航空券が必要な点は変わっていない。

アメリカン航空の乗客のためのバイオメトリック・ボーディング。 ソースはこちら The Dallas Morning News

2018年、アメリカンはロサンゼルス国際空港ターミナル4で90日間生体認証の試験を行っており、試験がうまくいけば技術の使用を拡大する考えだ

多数の航空会社が追加搭乗オプションとして顔認証も実装している。 ジェットブルー、ブリティッシュ・エアウェイズ、エアアジア、ルフトハンザ、デルタなど。 最後のものは、2017年にミネアポリス・セントポール国際空港にセルフサービスのバッグドロップを設置しました。

ビジュアル商品検索

ビジュアル検索がゲームに参入して以来、オンラインとオフラインショッピングの境界がなくなっています。 たとえば、アーバンアウトフィッターズのアプリにはスキャン+ショップ機能があり、消費者は実店舗で見つけたアイテムや雑誌に掲載されたアイテムをスキャンして、その詳細な説明を入手し、即座に注文することができます。

このような機能を持つアプリケーションは、ニューラル・ネットワークによって支えられています。 ユーザーがアップロードした画像を処理し、衣服の種類、生地、スタイル、色などの画像の説明(タグ)を生成します。 画像の説明文と在庫のある商品、タグをマッチングさせる。

ビジュアルサーチについては、「小売業におけるAI活用」の記事で紹介しています。 そこでは、画像および顔認識テクノロジが、Amazon Go のようなレジなし店舗をどのように実現したか、また、それらがどのように監視システムを強化し、店舗内のパーソナライゼーションを可能にしたかについて読むことができます。 1966年、数学者であり、MITコンピュータサイエンス&AIラボの元共同ディレクターであるシーモア・パパートは、サマービジョン・プロジェクトをコーディネートしていました。 研究者たちは、今日私たちが知っているようなコンピュータビジョン機能を持つシステムの重要な部分を、ひと夏の間に作り上げるという野心的な計画を持っていた。 「このプロジェクトの主な目標は、ビデオ検出器の画像を、物体らしい領域、背景らしい領域、カオスなどの領域に分割するプログラムのシステムを構築することである」と、プロジェクトの説明には書かれていました。

まあ、だいぶ時間がかかりましたね。 現代のソフトウェアは、多数の日常的なオブジェクト、人の顔、画像内の印刷物や手書きのテキスト、およびその他のエンティティを認識できます (画像認識 API に関する記事をご覧ください)。しかし、作業は継続し、より多くの企業や組織が画像認識やその他のコンピュータ ビジョン タスクを導入して競合企業に差をつけ、業務を最適化する様子をこれからも目撃し続けることになるでしょう。

コメントを残す

メールアドレスが公開されることはありません。