自動化できるアノテーション業務の範囲

2020年10月18日

自動アノテーションとは

AIプロジェクトに取り組む際、1つのネックになりがちなのが教師データのアノテーションです。データアノテーションの作業は主導で行うと大変手間が掛かってしまいますが、1つの解決策として、自動アノテーション(オートアノテーション)や半自動アノテーションを実現するツールがあります。

自動アノテーションとは、データに機械が自動でメタデータを含むタグ(アノテーション)を付与することをいいます。データ分類、セマンティックセグメンテーション物体検出用のバウンディングボックスなど、自動化できるアノテーション作業の種類は豊富であります。

 

自動アノテーションツール

例えば、Microsoft社が提供するVoTT (Visual Object Tagging Tool) は、画像や動画のアノテーションを行うための無償アノテーションツールです。CNTK、TensorFlow(Pascal VOC)、YOLO のアルゴリズムを使用する場合は、そのまま使用できる形式で出力できます。

他にも、米ペンシルバニア大学が提供する自動アノテーションエンジンALIPR.comや、動画アノテーション向けのCannotic.com、Playment、Edgecase.ai、dataloop.aiなどがあります。また、Alegion.com、Infolks、DataPure.co、Diffgram.comなど、画像向けの自動アノテーションエンジンであり、何か問題が起きた場合は手動修正も可能です。

自動アノテーションのメリット・デメリット

自動アノテーションは、AIによる業務効率化にも繋がり、大変便利なツールです。簡単なアノテーション作業でそこそこの精度で十分なAIプロジェクトの場合、自動アノテーションを使用してみると良いかもしれません。

但し、各AIプロジェクトにはアノテーションの適切なやり方や必要精度あり、それを全て満たす自動アノテーションツールが見つからない場合もあります。多くの条件があるAIプロジェクトの場合、必要な機能が取り揃っている自動アノテーションツールを見つけることは難しいかもしれません。また、自動運転や医療診断のAIプロジェクトは社会的に実装される際、人の命にも関わるので、できるだけ100%に近い画像認識技術が必要となるため、自動アノテーションでなく、人間参加型(human-in-the-loop)プロセスを用い、モデル検証を繰り返す作業フローが適切です。専門知識や機密情報保護などの条件がある場合ももちろん、最初からサードパーティの自動アノテーションソフトにデータをアップロードする訳には行かず、複雑な案件にも対応可能なAIベンダーに外注した方がより安全でしょう。

以上、自動アノテーションのメリット・デメリットを解説いたしましたが、いががでしたでしょうか。教師データのアノテーションでお困りの方は、ぜひ一度当社のアノテーションサービスについてご相談ください。

 

ライオンブリッジのAI教師データサービス

当社は20年以上に渡るAIプロジェクトの実績を持ち、データ作成・アノテーションサービスを提供しております。データサイエンティストや言語学者を含み、100万人のアノテーターが登録されているので、大規模なAIプロジェクトも迅速且つ正確に仕上げます。アノテーターは秘密保持契約に署名することが義務付けられており、データ保護のためにオンサイトスタッフやリモートスタッフを派遣し、アノテーターにお客様ご指定のツールを利用してもらうこともできます。必要に応じて案件に特化した秘密保持契約も作成できるので、データの安全性も保証しております。ご相談・無料トライアルはこちらから。

AI向け教師データの作成やアノテーションサービスを提供し、研究開発を支援いたします。

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。