【17個掲載】機械学習に使える金融、経済のデータセットまとめ

2019年03月15日

Lionbridgeチームは機械学習に使えるオープンデータセットの記事を連載しております。今回は金融・経済のデータセットを特集します。金融では何十年も前から定量的な記録があるので、AIと機械学習の応用に適している分野です。システムトレード、株価予想、不正検出などの分野で、AIは金融業界に革命をもたらしています。経済においては、機械学習は経済モデルをテストしたり、政策立案者が市民の行動を予測したりするのに使用できます。

 

金融・経済のデータセット

  1. Quandl: 投資専門家のための代表的な金融・経済データセット。世界トップクラスのヘッジファンドや資産運用管理会社、投資銀行のアナリストら25万人以上が使用。
  2. EUオープンデータ・ポータル: 経済だけでなく雇用、科学、環境、教育に関するEU各機関のオープンデータにアクセスできる。
  3. 世界銀行オープンデータ: 世界中の人口構成及び膨大な数の経済・開発指標をカバーしたデータセット。
  4. IMFデータ: 国際通貨基金による、国際金融、負債金利、外貨準備金、物価、投資などに関するデータ。
  5. フィナンシャル・タイムズ市場データ: 株価指数、商品、外国為替など、世界中の金融市場に関する最新情報。
  6. Googleトレンド: 世界中のインターネット検索と話題のニュースのデータを検証・分析。
  7. アメリカ経済学会(AEA): 米国のマクロ経済データを探す際に役立つ。
  8. 学校制度の財政: 米国の学校制度の財政状況に関する調査。
  9. 米国株式データ: 2009年以降の米国株式市場のヒストリカルデータ。毎日更新。
  10. シカゴオプション取引所ボラティリティ・インデックス(VIX): 市場が短期的変動をどのように想定しているかを表したS&Pによる指数。日々の始値、終値、高値、安値が含まれた時系列のデータセット。
  11. ダウ・ジョーンズ週間リターン: 週ごとの株式の収益率から成るデータセット。翌週どの株式が最も高い収益率を上げるかを決定できるようにアルゴリズムを学習させることを目的として、是非使用してください。
  12. EconData: 米国政府機関が作成し、様々なフォーマットと媒体で配布した数千に及ぶ経済時系列データ。パソコンで容易に使用できる効率的な標準フォーマットで整理されており、サイトを通じて一般に提供されている。
  13. Simfin: 証券取引委員会のウェブサイトにアップロードされた財務諸表のデータ。クリーンアップして1つの文書にまとめられているため、ダウンロード後直ちに作業に入れる。
  14. サウジアラビア公債: サウジアラビア通貨庁の提供による、2005年から2017年までのサウジアラビア公債のデータ。
  15. AssetMarco: 120カ国以上の25,000を超える指標から成るマクロ経済データベース.
  16. Eurostat Comext: 商品ごとに整理された1988年以降の貿易動向のデータセット。
  17. CIA世界ファクトブック: 世界各国の経済統計に加えて、人口、地理、通信、軍事に関する統計も含まれている。

 

LionbridgeのAI学習データサービス

当社はAI学習データの収集、アノテーション、検証などのサービスを提供しております。どのようなAI開発プロジェクトでもしっかりと支援いたします。世界の各タイムゾーンを渡る、100万人の認定クラウドワーカーが登録されているので、大規模な機械学習プロジェクトも素早く仕上げることができます。無料見積もり・ご相談はこちらからお問い合わせください。

機械学習用のデータを入手

メディア掲載結果

AI・機械学習の最新情報を配信中

Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。