【25万台の車】自動運転AIに使える車のデータセットまとめ

2020年07月22日

自動運転とは

自動運転(無人運転)とは、人間が運転操作を行わなくとも、AIにより自動車が自動で走行できることを示します。テスラの自動運転車やグーグルのウェイモのようなプロジェクトの台頭と共に、自律走行車業界は年々成長を続けているように思われます。自律走行車はコンピュータービジョンの一分野であり、コンピュータービジョンを様々に活用することによって高い収益を生み出せる可能性があります。

 

現在の自動運転の技術レベルは

「自動運転」という言葉を耳にすると、多くの方は、車に誰も乗車されていない状態、または人間が乗車していても、スマホをいじったり寝ていたり、運転操作は全く行わなくて良い状況を想像するでしょう。それは理想の自動運転かもしれませんが、現実的にまだ達していません。現在の日本では、AIによる自動的なブレーキやハンドル操作が行われる車は販売されておりますが、運転操作の主体はまだ人間の運転手です。このような自動車は「自動運転車」ではなく「運転支援者」と呼ばれています。

自動運転AIについては、SAE(Society of Automotive Engineers)という団体が定めた「SAE J3016」によってレベル分けがされています。

レベル名称主体者走行エリアルール
0運転自動化なし運転手運転手がすべてのタスクを担当
1運転支援運転手限定的速度かハンドルを運転手が対応
2部分運転自動化運転手限定的常時運転手がシステムを監督
3条件付き運転自動化限定的緊急時は運転手が対応
4高度運転自動化限定的運転手なしでの走行OK
5完全運転自動化限定なし運転手無しでの走行OK

 

自動運転AIの最新技術

自動運転AIは現在、運転手無しで走行できるレベルを達していませんが、研究開発は進化しています。例えば、YOLO(You Only Look Once)というアルゴリズムは2016年に発表され、

領域判定(物体があるらしい領域を提案)と対象分類(物体が度のクラスに分類できるか)を同時に行うことで、物体認識処理を高速化しました。YOLO以前のアルゴリズムは、バウンディングボックスを使い、それぞれに含まれる対象のクラス分類を行っていたため、バウンディングボックスの数が多いと認識に時間がかかってしまいました。

 

自動運転AIの未来

自動運転AIは、各国の自動車大手やIT企業の多くが取り組んでいます。米国では、Googleの兄弟会社Waymoが代表的で、2018年末、世界初の自動運転による配車サービス「waymo one」を発表しました。中国では、2015年に政府が発表した「中国製造2025」でも、自動運転の目標が含まれており、2013年に自動運転レベル4〜5の砕砂搭載率を10%とすることです。

日本では、トヨタ自動車が2016年よりモビリティサービス・プラットフォーム(MSPF)を提唱し、国内外のテクノロジー企業と協業を進めています。2018年10月には、トヨタ自動車あとソフトバンクの共同出資会社MONET Technologies(モネ・テクノロジーズ)が設立されました。翌年の2019年2月に、本の社会課題の解決や新たな価値創造を可能にするモビリティサービスの実現と普及に向け、事業開始されました。

 

自動運転向けの画像、映像アノテーション

あらゆるAIアルゴリズムと同様、自動運転AIの開発にかかせないのが、画像及び動画(画像フレーム)のアノテーションです。しかし、大量かつ高品質の画像を取得したり、信頼できる映像アノテーションサービスを見つけたりするのは困難であることが多いのです。数千件もの画像に自分で手作業でタグ付けするのは大変手間が掛かってしまいます。

当社の画像アノテーションサービスは、20年以上に渡り、AI学習データ周りのサービスを提供してきたノウハウを持ち、100万人の認定コントリビューターが登録されているので、大量の学習データ(教師データ)のアノテーションも素早く、正確に提供いたします。自動運転車における、物体検出用バウンディングボックスアノテーションや、シーン理解用のセマンティックセグメンテーションなど、幅広い画像アノテーション機能が揃っています。

無料トライアルも行なっていますので、まずはお気軽にお問合せください。

アノテーション 画像
当社の画像アノテーションプラットフォーム

 

自動運転開発に使える車のデータセット

自動運転の研究開発に役立つ車のビッグデータを含む、データセットを9件まとめました。これらのデータセットには25万枚の画像や静止画像が含まれていて、既にタグ付けが行われているものもあります。

都市の景観の画像ペア: 運転中の車からドイツの通りを撮影した動画を使用。2,975件の画像のペアが含まれるデータセットで、各画像ファイルは左側にオリジナルの静止画像、右側に意味的アノテーションを施した同じ画像が並べられている。

GTI車両画像データベース: 道路上の車両を後方から撮影した画像3,425件と、車両が含まれない道路の画像3,900件から成るデータセット。

KITTIバウンディングボックス付きオブジェクト検出: カールスルーエ工科大学のベンチマークスイートのオブジェクト検出セクションから14,000件以上の画像を取得して作成。テスト画像7,518件とバウンディングボックスのラベルが別個のファイルに含まれるトレーニング画像7,481件から構成される。

 

自動運転 データ
KITTIオブジェクト検出データセットからのサンプル画像

 

LISA信号機データセット: 車を対象としたデータセットではないが、自律走行車アルゴリズムの学習で非常に役立つ画像データセット。夜間と日中の動画の静止画像がトータルで43,007件含まれ、113,888個の信号機がタグ付けされている。信号機に焦点を置いたデータセットであるが、ほぼ全ての画像に信号機と車両が含まれる。

ネパールの車両: カトマンズの通りで撮影された30件の動画から切り取った4,800台の車両画像から成る。4,800件の画像のうち1,811件は二輪車、2,989件は四輪車である。

悪天候における交通監視: それぞれ5分ほどの長さの動画22本から構成されたデータセット。RGBカラーカメラと赤外線サーマルカメラの両方を利用して撮影されているので、130,000件のRGB画像とサーマル画像のペアが含まれる。

スタンフォード車両データセット: スタンフォードAI研究所から取得したデータセット。196種類の車両の画像16,185件が含まれる。

自動運転車の開発に利用できるセマンティックセグメンテーション: Lyft Udacityチャレンジの一環として作成されたデータセット。5,000件の画像にセマンティックセグメンテーションがタグ付けされている。

TME(トヨタ・モーター・ヨーロッパ)高速道路データセット: 27分の動画に相当する28件のビデオクリップで構成されたデータセット。30,000件の画像が含まれ、車両がタグ付けされている。

 

自動運転向けの画像データをお探しですか?

お探しの自動車データセットが見つからない場合は、当社が作成いたします。顧客中心のアプローチを用い、学習データの作成や評価・検証サービスの提供を行っています。貴社のAIプロジェクトに最適な教師データセットを作成するために、まずは貴社の酷評、ニーズ、そして予算を十分理解するよう心がけます。こちらから、お気軽にご相談ください。

画像のアノテーションでお困りでしたら、お気軽にお問い合わせください。 無料でお見積もりいたします。

メディア掲載結果

AI・機械学習の最新情報を配信中

Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。