【24個掲載】機械学習に使えるeコマースと小売のデータセットまとめ

アレックス・ニュウエン | 2019年02月01日

人工知能 (AI) はオンライン小売業者に大きな成長の機会を提供します。機械学習技術によってeコマース企業は消費者と活発に対話しながら売上を伸ばし、無駄を削減して効率を高めることができます。

それだけでなく、eコマース企業は大量のデータをすぐに手に入れることができます。機械学習の開発者にとって問題となるのはデータが入手できるかどうかということです。一般にeコマースデータには機密情報が含まれているため、公開されているデータベースをみつけるのは困難です。

Lionbridge AIはネット上を調べて機械学習に使えるeコマースの公開データセットを収集しました。どうぞご活用ください!

 

製品のデータセット

 

商売取引のデータセット

 

検索関連性のデータセット

  • eコマース検索関連性: 五つの主要な英語eコマースサイトからの画像URL、ページの順位、各製品の説明、各結果につながる検索クエリ等を含むデータセット。
  • Best Buy検索クエリNERデータセット: 手作業でラベル付けしたbestbuy.comの検索クエリを含むデータセット。検索クエリはブランド、型名、カテゴリー名等、さまざまな重要なエンティティに分類されたフレーズを持つ。

 

口コミのデータセット

 

Eコマース業界のデータセット

  • 年間小売業調査 (ARTS): 米国の年間総売上、eコマース売上、年末在庫、在庫対売上率、仕入、総事業費、米国外の在庫の見積り。
  • 経済センサス: 全国レベルから地方レベルまで、五年ごとに産業や団体の事業活動の詳細なポートレートを提供。
  • E-Stats: メーカー向け出荷、卸売・小売売買、サービス産業の収益等、さまざまな経済活動の経済活動を評価基準とした調査。
  • EU対外貿易データセット: 未調整・季節調整の輸出入額と貿易黒字、数量指数; 貿易指数の価格条件; 商品ごとや原産国・仕向け国ごとに分類された輸出入額。
  • 1999年~2015年の商品カテゴリーごとのeコマース売上: 1999年から2015年までの商品ごとのeコマース売上と複合年間成長率を示すセンサスデータ。

 

Lionbridge AIのこれまでのデータセット集はこちらでご覧いただけます。機械学習アルゴリズムの学習用に必要なカスタムデータがまだみつからない場合は、Lionbridge AIにお問い合わせください。お客様の具体的な機械学習プロジェクトのニーズに合ったカスタムAI学習データを300言語で提供いたします。

Lionbridge AIがお手伝いできることについて、詳しくはご連絡ください

著者紹介
アレックス・ニュウエン

Lionbridgeのマーケティング・マネージャー。米サンフランシスコ市出身、東京住居。好きなものは、音楽、ソフトクリーム、日本語の勉強、そして様々な文化xデザイン。

メディア掲載結果

AI・機械学習の最新情報を配信中

Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。