【9個掲載】リーガルテックに使える法律のデータセットまとめ

2020年01月30日

リーガルテックとは?

リーガルテックとは、リーガルサービスを提供するために使用される技術のことです。リーガルテックを開発している企業は一般的に、リーガル市場を革新的な技術で、法務の自動化を支援することを目的としています。例えば、Legal ForceはAIを用いた契約書レビューのサービスを提供しています。

AIは幅広い業種で大きなニュースになっていますが、法律のAIはあまり思い浮かびません。しかし、AIは既に多種多様な場面で法律分野を変革しています。まず、従来の煩雑な過程をストリーミングしており、専門家はより高度なタスクに注力できるようになっています。

法律分野の機械学習アプリケーション開発に興味をお持ちの方のために、Lionbridgeチームは高品質の公開データセットをまとめました。

 

リーガルテックに使えるデータセット

  1. Legal Case Reports: 自動要約と引用分析のための4000の訴訟事例の文例集。各ドキュメントについてキャッチフレーズ、引用文、引用キャッチフレーズと引用分類が含まれる。
  2. Department of Justice Open Data: 米国司法省が2013年に公開した価値の高いデータセットで、犯罪関連のデータや、統計報告等の未加工データが含まれる。
  3. 究極の裁判データベース: SCDBは1791年から2017年までに裁判所で決定された訴訟についての200件以上の情報を収録。
  4. 判例法アクセスプロジェクト (CAP): 判例法アクセスプロジェクト (CAP) APIとバルクデータサービスは、 360年間の米国判例法に従い、4000万ページの米国の判決と約650万件の個別の判例を収録。
  5. 司法局: 法執行局、刑務所、保護監察局、法廷についてのデータがみつかる。
  6. 特許訴訟: 52年間にわたる500万以上の関連文書の74000例以上を扱う。訴訟側、その法定代理人、結果、場所、日付の詳細を記載したファイル五種類。
  7. Google特許公開データ: 国際特許システムの実証的分析用に公開された関連データベーステーブルのコレクション。
  8. カリフォルニアの犯罪と法の執行: カリフォルニア州の犯罪率と法執行職についてのデータ。
  9. クレジットカード契約データベース: 数百人以上のカード発行者のクレジットカード契約のデータベースを保有。

 

これまでのデータセット集を見逃している方は、こちらですべてお読みいただけます。

 

リーガルテックに使えるデータセットをお探しですか?

お探しのデータセットが見つからない場合は、当社が作成いたします。データ収集やアノテーションのサービスを中心に、AI教師データを提供しております。当社がお手伝いできることの詳細についてはこちらにご連絡ください

AI開発に肝心な学習データを提供いたします

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。