【11個掲載】機械学習に使える気候変動データセット

2020年10月28日

気候変動を語る上でデータは中心的な役割を果たします。多くのデータサイエンティストは次のリストに挙げたような気候変動データセットを利用して視覚化やモデル作成を行い、地表面温度や海氷域面積などを測定、追跡しています。これらのデータセットの多くは、気候変動の状況や原因に関して人々が貴重なインサイトを追加・貢献できるように公開されています。 

 

気候変動データセット(グローバル)

バークレーアース地表面温度データ: バークレーアースデータページから取得したデータセット。1743年11月1日から2015年12月1日までの地表面温度の記録が含まれる。データセットは次のようないくつかのファイルに分割されている。 

  • 世界の地表面温度
  • 国別の地表面温度
  • 州別の地表面温度
  • 大都市別の地表面温度
  • 都市別の地表面温度

 

世界の気候変動データ: 気候変動ナレッジ・ポータルと世界開発指標から取得した情報が含まれるデータセット。温室効果ガス排出量やエネルギー消費量など様々なトピックがカバーされている。 1990年から2011年までのデータが含まれる。

世界の温室効果ガス排出量: 国連によって作成されたKaggleデータセット。1990年から2014年までの温室効果ガスインベントリデータが含まれ、公式の国際連合ウェブサイトでは2017年までデータセットが更新されている。以下のガスに関する国別地域別の排出量データが集められている。

  • 二酸化炭素(CO2)
  • メタン(CH4)
  • 亜酸化窒素(N2O)
  • ハイドロフルオロカーボン(HFC)
  • パーフルオロカーボン(PFC)
  • HFCとPFCの不特定混合物
  • 六フッ化硫黄(SF6)
  • 三フッ化窒素(NF3)

日毎の海氷域データ: 米国立雪氷データセンターから取得した気候変動データセット。氷河、氷、雪、凍土に関するデータなど、地球の雪氷圏に関する情報が含まれる。データセットには、年、月、日、海氷域、海氷が消滅した海域、出典、半球を示す七つの列が表示されている。海氷域とは、海氷のある海域のこと。

気候変動がコーヒーの生産に与える影響: 気候変動がニカラグアで生産されるコーヒーの品質に及ぼす影響を調べるため、Harvard Dataverseから取得されたデータセット。六つのGeoTIFFラスターファイルに分割されている。

ロシアの気候変動: ロシアは世界最大の二酸化炭素排出国の一つなので、このStatista(スタティスタ)のポータルでは、1985年から2019年までのロシアの二酸化炭素排出量に焦点を当てている。ロシアで汚染にさらされている人口の割合に関する情報も含まれる。

※このデータセットはStatistaから取得したものであり、このデータセット内の一部のグラフや統計の閲覧には、Statistaのプレミアムアカウントが必要となる場合があります。 

気候変動ナレッジ・ポータル: この世界銀行グループのポータルは、過去のデータと予測に基づいて気候変動データを視覚化する操作しやすいプラットフォームを提供する。エネルギー、水、農業、健康など、気候変動によって影響を受けるセクターごとにデータを閲覧できる。さらに、国別、地域別、流域別での閲覧も可能であり、データは無料でダウンロードできる。

 

米国の気候変動データ

ニューヨーク州における気候変動の予測と影響: ニューヨーク州政府ウェブサイトによってキュレートされたデータセット。2020年代、2050年代、そして2080年代の三つの期間の気候を予測したデータセット。データセットには以下のデータ変数が含まれる。

  • 年間平均気温
  • 年間平均降水量
  • 異常気象
  • 海面上昇

 

SGMA気候変動資源: カリフォルニア州自然資源庁によるデータセットで、カリフォルニア州の降水量と水域の変化に関するデータから構成される。2030年と2070年の気候条件の予測も含まれる。

 

ソーシャルメディアの気候変動データセット

ハーバード大学による気候変動に関するツイートIDデータセット: 2017年9月から2019年5月の間に収集された気候変動に関する3900万件を超えるツイートのIDデータセット。ツイートは気候変動に関する以下のハッシュタグを利用して追跡、キュレートされている。

  • #climatechange(気候変動)
  • #climatechangeisreal(気候変動は本当)
  • #actonclimate(気候変動防止活動)
  • #globalwarming(地球温暖化)
  • #climatechangehoax(気候変動はウソ)
  • #climatedeniers(気候変動の否定論者)
  • #climatechangeisfalse(気候変動は誤り)
  • #globalwarminghoax(地球温暖化はウソ)
  • #climatechangenotreal(気候変動は本当ではない)

 

気候変動に対する感情: 気候変動に対する感情に基づいて人間のコントリビュータがツイートを分類したCrowdflowerのデータセット。ツイートは次のように分類されている。

  • Yes(はい) = 地球温暖化が起こっていることを示唆するコンテンツ
  • No(いいえ) = 地球温暖化が起こっていないことを示唆するコンテンツ
  • I can’t tell(わからない)= 曖昧なコンテンツあるいは、地球温暖化と全く関係のないコンテンツ

 

気候変動データセットをお探しですか?

お探しの気候変動データセットが見つからない場合、当社が作成いたします。お客様のニーズに合わせた気候変動データの作成やアノテーションサービスを提供し、AI研究開発をサポートいたします。データサイエンティストや言語学者を含み、100万人のアノテーターが登録されているので、大規模なデータベースの作成なども迅速且つ正確に仕上げます。アノテーターは秘密保持契約に署名することが義務付けられており、データ保護のためにオンサイトスタッフやリモートスタッフを派遣し、アノテーターにお客様ご指定のツールを利用してもらうこともできます。必要に応じて案件に特化した秘密保持契約も作成できるので、データの安全性も保証しております。ご相談・無料トライアルはこちらから。

AI向け教師データの作成やアノテーションサービスを提供し、研究開発をサポートします。

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。