活用事例

数万社におよぶ世界中の企業様にご利用いただいています

アノテーション

検索精度の向上

大手オンライン旅行会社Traveloka(トラベロカ)のために20万件の検索クエリを分類しました。このデータは、複数の商品カテゴリーで結果を返すことができる検索エンジンを構築するために利用されました。

データ作成

対話チャットボット

ユーザーの感情に適した対話システムを開発している株式会社ZAIZENに、5000対話を含む会話コーパスを提供し、日常会話に対応できるパーソナルAIの構築を支援いたしました。

データ作成

翻訳アプリの開発

非ネイティブ話者が話す英語の音声データセットを作成し、国立研究開発法人情報通信研究機構(NICT)が提供する多言語翻訳アプリVoiceTraの開発をサポートしました。

データ検証

広告評価(ソーシャルメディア)

ソーシャルメディア大手企業のために、現地の多様なクラウドワーカーを4,000人以上認定し、10の業界を渡る広告を数百万件評価しました。

アノテーション

感情分析

世界最大のIT企業の一つであるお客様のために、20,000件の文章に14言語で感情アノテーションを行い、テキストから感情を抽出するプラットフォームの開発を支援いたしました。

データ作成

オーダーメイドの音声データ

30言語で、6~75歳のネイティブ話者の音声サンプルを20時間分作成し、お客様の音声検索エンジンの開発を支援いたしました。

データ検証

音声認識

音声認識ソフトウェアを開発している大手IT企業のために、当社の言語学者は文字起こしの検証、発音の評価、音韻データの作成を行いました。

アノテーション

画像のキーポイントアノテーション

スポーツ選手の1000枚の写真に、体の部位17箇所にキーポイントアンテーションを付与し、動画フレームを分析するためのコンピュータビジョンモデルを構築するベンチャーキャピタルの支援をいたしました。

データ作成

教師データセット作成(テキスト)

世界有数のIT企業とのプロジェクトで、英語とフランス語による30,000件の会話データを収集し、アノテーションを付与しました。

アノテーション

自然言語処理ツールの多言語化

17言語で自然言語処理ツールを提供し、自然言語処理ソフトウェアに特化するお客様のサービス拡大を支援しました。25個のプロジェクトでソフトウェアの多言語化をサポートさせていただきました。

データ作成

校正ツールの開発

文法スペルチェックシステムを開発している、世界有数のIT企業のために、16言語でルール開発、品質保証、メンテナンスサービスを提供しています。

データ検証

大手通信企業の機械翻訳を 再訓練

日英の言語ペアを専門とするチームが、日本最大級の通信企業による機械翻訳の改善を支援。この学習データは、同社の機械翻訳アルゴリズムの開発、再訓練に活用されました。

データ作成

ホームアシスタントの開発

ホームアシスタントを開発しているお客様のために、機械が様々なネイティブ・非ネイティブによる文章を理解し返答するよう、学習させました。

データ検証

広告評価(Webコンテンツ)

当社の認定クラウドワーカーが、大手旅行会社の広告の言葉遣いやレイアウトを評価しました。

データ作成

コンテンツ要約

大手ソーシャルニュースサイトのためにチームとガイドラインを作成し、数百の投稿につき、それぞれ最も有益な三つのコメントをで選別しました。

データ作成

大手モバイル・メッセージサービス向けのコーパスライセンス

機械翻訳の深層学習モデルの訓練用に、20万文以上の日英対訳データのコーパスライセンスを提供いたしました。

データ作成

音声データセットを作成

多言語対応の自然言語処理モデルを開発している大手情報通信企業のために、音声データを収集しました。さらに、10言語で市場特性な自動音声認識ソフトウェアを検証しました。

データ作成

チャットボット向け会話コーパス

東京の駅構内に設置するチャットボットを学習させるために、四つの言語ペアに(英語、中国語、簡単時中国語、韓国語)500文を含む会話コーパスを提供いたしました。

アノテーション

コンテンツ分類

コンテンツ分類をするための機械学習モデルを学習するために、英語文書類を一万枚提供いたしました。

データ作成

チャットボット向け教師データ

ホテル向けチャットボットのために、約25万単語を英語から日本語に翻訳しました。当社は担当翻訳者が各年代ごとにある程度均等になるように調整し、直訳ではなく、自然な言い回しになることを重視して訳しました。

データ検証

位置情報取得の検証

大手ナビゲーションアプリ運用会社のために、40業界に渡り、現地の認定コントリビューターが、数百万の検索結果の評価とデータ検証タスクを実行しました。

アノテーション

画像アノテーション(バウンディングボックス)

フルスタックAI企業のために、1000枚の画像に日本語の文字のバウンディングボックスを描きました。さらに、画像の分類も行いました。

データ作成

AI-OCRモデル

非営利団体のお客様のために、数百年前の手書きの歴史的公文書や書類を文字データに起こしました。このお客様はAI-OCRモデルを構築するために、当社の学習データセットを利用しました。