【15個掲載】地図アプリの開発に使えるGISデータセット

2020年01月29日

Appleマップが最初に公開された頃は地名の不正確さや間違いがあり、Apple社が厳しく批判されました。例えば、ニューヨークの象徴とも言えるマディソンスクエアガーデンは、「ガーデン」という語を含んでいるだけで自然地域として分類されていました。アプリに苦情や批判が相次いだため、ティム・クックがサービスの向上を約束する公式の謝罪文を掲載するほどでした。

それ以来、Appleは誤りを修正し、新しい機能を開発し、さらにはプラットフォームの大幅な見直しを計画して、ソフトウェアを大きく改良しました。このことから、地図アプリでは、最も正確なデータを持つアプリが勝つことが分かります。

一般にはあまり知られていないことですが、地図アプリの成功を後押ししているのは、人間がタグ付けしたデータです。人間が位置データの強化・検証に関与することによって、エンドユーザーは大きな価値を享受します。人間がタグ付けを行ったデータ地図アプリの改良にどのように役立っているかについて以下に三点まとめました。

 

ローカル検索の関連性

検索エンジンの中核となる機能は、正確で関連性のある結果を提供することです。地図アプリの場合、ローカル検索は、特定の地域で何かを見つけることを目的としています(例えば、「東京の中華料理」)。他社の製品より精度の高いローカル検索結果を提供できれば、地図アプリにとって非常に有利です。そのため、ローカル検索結果の精度を検証することは、ユーザーを維持するために非常に重要です。

検索関連性とは、検索結果がユーザーの求めているものにどれくらい一致しているかを意味します。そして、ローカル検索の関連性を向上させるための最も重要なリソースは人間の知識なのです。

検索アルゴリズムが高精度と高再現率を達成するためには、人間がタグ付けした高品質のデータで継続的に学習させる必要があります。つまり、データ作成の裏側では、人間が何百万件もの検索クエリと結果を突き合わせて評価しているのです。

 

地理データの強化

地図アプリにとってもう一つの重要な要素は、ビジネス情報の正確さです。完全で詳細かつ最新のビジネス情報を保有していることもローカル検索の関連性の向上に役立ちます。正確なローカルリスティングを維持しておかなければ、検索エンジンのデータの信頼性が失われ、ユーザーが次に検索するときは競争相手のアプリを使うようになるでしょう。

データの精度を向上させる最も良い方法は、その市場の専門家に各場所のメタデータと地理情報を検証させることです。全ての市場の顧客に可能な限り正確で関連性のあるビジネスリスティングを提供するためには、人間があらゆる種類のデータを見直して検証し、クリーニングし、ラベル付けする必要があります。 

 

経路の検証

地図アプリでもう一つの重要なのは、最も効率的なドライブルート、自転車ルート、徒歩ルートを素早く見つけられる機能です。 特に発展途上の市場では、現実的なシナリオに即した正確なローカライズ化は地図アプリの課題です。

この過程において人間は大きな役割を担っています。ソフトウェアテスターは、地点間のルートが正確で安全、そして時間通りであることを確認する作業を行っています。そして、地元の専門家だけが持つ知識を利用することができるように、地元の評価者が雇われてこの作業にあたっています。

 

地理・GISデータを収集

地理情報システム(GIS)は、地理空間データを取得、保存、操作、表示するために設計されます。そして、GISには、交通管理やライドシェアアプリの最適化など様々な活用の可能性があるので、GISと組み合わせた機械学習がますます活発化しています。つまり、このようなロケーションベースのソフトウェアは全て、大規模な構造化された地理空間データを基盤として作成されているのです。

Lionbridgeチームは、地理情報システムの構築や機械学習のために誰でも無料で入手できる公開地理データがいくつか存在します。お客様のお役に立てるよう、公開されている優れた地理データセットを15個まとめました。

 

GISデータベース

ナチュララルアース・データ: 地図の作成に必要な最も一般的な要素を含む無料のラスターデータおよびベクターデータのパッケージ。見た目の美しい形式で主要な地図機能(文化的、物理的、ラスター)を提供。

地球地図: 地球地図国際運営委員会によって作成された地球地図。地球全体をカバーする一連のGISレイヤーを特徴とし、交通機関、標高、排水、植生、土地利用、人口に関する情報が提供されている。 

ArcGISオープンデータ: 世界中の2,601の機関が公開しているGISデータセット230,981件にアクセスできるオープンデータポータル。

Googleランドマークデータセット: Googleランドマーク認識チャレンジの一環として公開されたデータセット。世界のランドマークのテスト画像、トレーニング画像、インデックス画像が含まれる。コンピュータービジョンタスクにおける認識と検索を評価するために二つのカテゴリーに分類されている。

UNEP GEOデータ: 国連環境計画によるオンラインデータベース。国別、準地域別、地域別および地球全体の統計や地理空間情報として500個以上の異なる変数が含まれる。

ONS地理ポータル: あらゆる種類の地理情報に無料でアクセスできるオープンポータル。

USGS歴史的地形図: 過去125年間のUSGS地形図の電子コピーをGeoPDF形式で提供。

DIVA-GIS国別データ: 数々の情報源から収集した国別地理データが含まれる。このウェブサイトを利用すると、世界のどの国についても簡単な地理(GIS)データをダウンロードできる。

ナチュラルアース: ベースマップのためのコンテキストデータおよびグローバル境界データを取得できる優れた情報源。

国立地球物理データセンター: 標高モデル、土地被覆、地震学を含む全ての無料データのリスト。

グローバル多重解像度トポグラフィー: 地上および海底の地形をカバーする解像度約100mの格子状の標高データ。

SRTM: 世界のほとんどをカバーするシャトル・レーダー・トポグラフィー・ミッションからの標高データ。

北米環境アトラス: 土地被覆、環境汚染、気候、生態系、人間の影響、絶滅危惧種など、北米大陸全体の環境データがラスター形式とベクター形式で含まれる。

GDEM: ASTER衛星画像から取得した解像度30mの地球全体の標高データ。

オープン・トポグラフィー: 高密度点群や加工済みDEM(数値標高モデル)として、高解像度の地形データへの無料アクセスを提供するサイト。

 

Lionbridgeが提供するGISデータ

お探しのデータセットが見つかりませんか。カスタマイズした地理データをお探しでしたら、 ぜひ営業チームにお問い合わせください。当社の100万人の専門家チームが効果的な機械学習に必要なデータを提供いたします。地図アプリにおける著しい進歩にも関わらず、IT大手は競争を勝ち抜くため、依然として人間の知識に依存しています。

AI開発に肝心な学習データをご提供いたします

メディア掲載結果

AI・機械学習の最新情報を配信中

Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。