ディープラーニング初心者が簡単に物体検出アルゴリズムを作る方法

2020年03月26日

物体検出アルゴリズムとは画像内にある物体を認識する手法のことで、コンピュータビジョンの中で盛んに研究されている分野です。ビジネス活用として例を挙げると自動運転顔認証、疾患検知など多方面で活躍が期待されています。ニーズはあるものの物体検出アルゴリズムを実装するにあたって、機械学習やコンピュータサイエンスの知識を身につけたAI人材でないと難しいと言われることがありますが、必ずしもそうではありません。今回はAI人材でなくても簡単に物体検出アルゴリズムを作る方法を紹介します。

 

CNN(Convolutional Neural Network)とは

CNN(Convolutional Neural Network)はAIが画像内の物体を認識するときの基本となる仕組みです。数字を判別する学習を例にすると、CNNでは画像にフィルタリングをかけて画像を変換していきます。

 → 

MNISTデータセットに含まれる画像(左)、フィルタリング後画像(右)

 

変換した結果を1つの特徴量として、0に共通する特徴や、5に共通する特徴を見つけ出します。学習処理ではどのような変換をすれば数字を判定する上で重要な特徴にできるかという試行錯誤が行われます。ニューラルネットワークの入力から出力までにはこのような処理が行われて数字を判定しています。

物体を検出するためのパラメータの数はアルゴリズムによって異なります。数百万や数千万あることもあり、どのような特徴で判断しているかを人間が理解するのは難しいです。OpenAIでは以下の記事でAIと人間の感覚の違いを示しています。以下の画像でAIは左の画像をパンダと判断していますが、右の画像はテナガザルと判断してしまっています。学習したAIの判断基準を理解するのは近年研究が進んでいて今後明らかになっていく可能性があります。

 

物体検出アルゴリズムの簡単な作り方

物体検出アルゴリズムを実装するのは容易ではありませんが、クラウドサービスを活用することで初心者でも簡単に高性能なものを作ることができます。代表的な物体検出アルゴリズムサービスはMicrosoft Azure Custom VisionGoogle Cloud AutoMLAmazon Rekognition Custom Labelsなどがあります。

これらはいずれも検出したい物体をアノテーションした画像をアップロードして、機械学習は簡単なGUI操作か数行のコーディングをするだけで強力なアルゴリズムで学習することができるサービスです。3つのサービスは細部では違いがありますが、基本的な機能としてはどれも共通です。

アノテーションは犬の検出の例を挙げると以下のように、検出したい物体に犬であることをラベルづけしたデータを用意するだけで、特別なスキルを必要とするものではありません。したがってAI人材でなくても熟練者と同等の性能の機械学習モデルを作れることもあります。

VOC2012データセットに含まれる画像に犬のバウンディングボックスアノテーションを加えた画像

 

物体検出アルゴリズムの予測精度を高める方法

パンダの例で示したように機械学習の判断は間違うことがあります。性能を上げる方法として大きく分けると2つあります。

  • 学習アルゴリズムを改良する
  • データの質と量を改良する

どちらも重要ですがクラウドの搭載アルゴリズムは強力ですのでデータを改善することを第一に考えていいと思います。正しくアノテーションされたデータを増やすのは時間と費用がかかりますので、アノテーションツールやクラウドソーシングを活用しましょう。アノテーションの外注についてはこちらの記事で相場について述べられていますので参考にしてみてください: 画像アノテーションの外注費は実際、いくらが相場?

 

まとめ

物体検出アルゴリズムの仕組みとクラウドを活用した作り方を紹介しました。機械学習未経験者や数学が苦手な人からするとディープラーニングは敬遠されがちですが、本記事で紹介したような方法であれば簡単に物体検出アルゴリズムの実装が可能です。物体検出以外のアルゴリズムもクラウドサービスが専門性を要する処理をカバーしていることが多いため、これを機に始める人が増えて業務改善や研究開発の促進につながると幸いです。

 

※ 本記事は、椎橋怜史様による寄稿記事です。
著者プロフィール: 2016年東京工業大学情報理工学研究科修士課程修了、同年株式会社LIFULL入社。データサイエンティストとして主に不動産関連の機械学習を用いた研究開発や不動産ポータルサイトLIFULL HOME’Sのデータ分析に従事。

 

LionbridgeのAI学習データサービスについて

AI向け教師データの作成やアノテーションのサービスを提供し、研究開発を支援しています。世界の各タイムゾーンを渡る、100万人のコントリビューターが登録されており、大規模なAIプロジェクトも素早く仕上げることができます。お問い合わせ・見積もりはこちらから。

画像データやアノテーションサービスをお探しでしたら、お気軽にお問い合わせください。 無料でお見積もりいたします。

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。