世界最先端を誇る、中国語の音声認識

2020年06月11日

中国の大都市の雑踏の中で周囲を観察すると、変わった現象に気づくでしょう。ほとんどの国では人々が携帯電話に文字を入力していますが、中国では大部分の人があらゆる種類の連絡にボイスメモを送っているのです。

この技術は単に親しい間柄の人とのちょっとした連絡に使われるだけではありません。中国のコールセンターは自動応答を生成するために音声合成技術を利用していますし、裁判所は長い裁判手続を転写するため音声認識ソフトウェアに頼っています。また、中国で人気のライドシェアアプリ滴滴出行も運転手への発注に音声技術を利用しています。

音声技術や音声認識、人間のように話すAIは西洋より東アジア諸国の方がずっと進歩しています。550億ドルの規模を誇る音声認識業界は、2018年から2025年までの間に年率17%で成長すると予測されています。人工知能を基盤としたソフトウェアが主軸となり2017年には71%のマーケットシェアを占めた音声認識市場は、2018年から2025年の間、約30%という驚異的な割合で成長することが期待されています。

 

音声認識の仕組み

音声認識ソフトウェアは、発話された音声を分析することによって機能します。話しかけられた言葉をフィルターにかけ、機械が「読む」ことができる形式にデジタル化してからその意味を分析します。そして、アルゴリズムや以前のインプットを基にして、発話内容をかなり正確に推測することができます。

中国における音声認識が非常に興味深いのは、中国語の話し言葉には130種類もの方言があり、30種類の書き言葉があるので中国語の自然言語処理は特に複雑だからです。このため、最先端の技術ソリューションや膨大な加工データに対する需要が高まっています。

 

中国におけるAI市場の急速な成長

中国企業はAI技術への投資を増やし、いわゆる「第四次産業革命」の経済効果を利用してきました。実際、中国政府は、世界的なAI開発場として2030年までに1500億ドル規模のAI産業を構築するという目標を自ら掲げています。

過去数年、初期段階のスタートアップ企業からテンセントや百度など地位を確立した企業まで数百社に及ぶ中国企業が音声認識市場に参入し、車載インテリジェントシステムやスマートホーム、ウェアラブルデバイスなどのマーケットセグメントになだれ込んでいます。中国のスマートホーム市場だけでも2018年にはその規模が70億ドル以上に達しており、今後六年間でさらに五倍に成長するだろうと予測されています。スマートスピーカーや音声アシスタントが その中核になっています。

最近の中国では、音声認識に限らず、ビッグデータやAIを活用した新しい産業の育成に力を注いでいるようです。2015年5月に発表された「中国製造2025」は、2025年までに中国の製造業発展のロードマップであり、重点分野はITをはじめ、ロボットや航空宇宙設備、農業設備、バイオいい量などと多岐に渡り、特にAI技術の取り組みを強化することが名言されました。中国製造2025は、ドイツ産業改革プロジェクト「インダストリー4.0」の影響を受けて作成されたと言われています。また、2017年7月に「次世代人工知能発展計画」、同年12月に「次世代人工知能産業の発展促進に関する三年行動計画(2018〜2020年)などが発表されています。

 

アイフライテック: 音声認識において中国で最も注目を集める企業

中国の音声認識市場の70%を占めるAI企業アイフライテックに触れずに中国語の音声認識について語るのは難しいでしょう。現在、五億人以上の人がアイフライテック・インプットというアプリを使っていますが、ボイスメッセージはこのアプリによってクリアテキストに変換されて送信されます。アイフライテックは、音声起動のスマートスピーカーやイヤホン、家庭用ロボットなどAIベースの技術によって、世界で最も重要な企業の一つになっています。

そして、アイフライテックの音声認識技術が中国の至る所で活用されているため、この技術は日々、賢くなっています。1999年創業のアイフライテックは、2010年、中国で初めて、そして世界ではグーグルに続いて二番目に音声入力製品を開発し、自然言語処理を自社ソフトウェアに利用し始めました。このシステムは98%以上の精度を誇り、22種類の中国語の方言に対応しています。

 

中国のAI市場が成長著しいのはなぜか?

中国のAI市場が他国と比べて著しく成長を遂げているのにはいくつか主な理由があります。

  • 外国企業との競争の欠如:アマゾンエコーもグーグルホームも中国市場に浸透していません。さらに、米国のテクノロジー企業は非常に厳しい規制に直面しています。米国のテクノロジー企業の中で標準中国語に対応しているのはアップルのiPhoneのシリだけです。このような状況によって、中国企業は自国の巨大な消費者市場から利益を得ることができるのです。
  • 豊富なデータ: 巨大な規模を誇る中国市場はAI開発を促進させるための学習データの宝庫です。 WeChatだけでも月間アクティブユーザー数は10億人を超えています。中国のモバイル決済による支払金額は米国の50倍に上り、電子商取引による購入額は米国のおよそ二倍になっています。 これらから得られる豊富なデータは中国企業のAIの改良に利用されています。
  • 政府からの莫大な資金援助:中国政府はテンセントやアリババなどのテクノロジー企業と独自に緊密に連携しています。そのため、テクノロジー企業は政府からの資金援助を受けたり政府が所有するデータを利用したりすることができます。その見返りとして、政府はデータを迅速にAI製品に活かす上でAI企業の能力に頼っています。

かつては他国の製品を真似した商品ばかりの市場として軽視されていましたが、中国のAI開発は過去数年で大きく進化しました。今日、中国は音声認識だけでなく、コンピュータービジョンや機械翻訳などの機械学習においても世界で最も重要な企業を有しています。

政府から莫大な資金援助を受け、豊富なデータやスマートインフラ、世界有数のAI研究を利用することができる中国は、すぐに米国に追いつくでしょう。そしてその勢いはいまだ衰えを見せていません。

 

Lionbridgeの音声データサービス

当社は音声データの収集、アノテーション、検証などのサービスを提供しております。どのような機械学習プロジェクトでもしっかりと支援いたします。世界の各タイムゾーンを渡る、100万人の認定クラウドワーカーが登録されているので、大規模なプロジェクトも素早く仕上げることができます。こちらからお気軽にご相談くださいませ。

多言語の音声データを入手

メディア掲載結果

AI・機械学習の最新情報を配信中

Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。