音声解析の概観と応用例

2020年08月25日

音声解析とは

音声解析とは、音声データの周波数の構造を明らかにすることをいいます。音声分析、音声波形解析、スペクトル解析とも呼ばれます。他の非構造化データと同様、音声データを機械学習に活用させる前に、前処理が必要となります。前準備として音声データを大量に集め、人間がその音声波形を見たり聞いたりしながら、波形を解析し、分類していきます。例えば、自動音声認識システムに学習させ、環境や状況に関わらず人間の音声を理解し、反応できるようにするためには、学習用に大量の言語データが必要となります。

 

音声解析の応用例

音声データを扱った機械学習の多くは、まず最初に音声解析を用いています。音源分離や音声強調など、音声解析の応用例を以下にまとめております。

音声強調: 音声強調とは、機械学習を用いて音声信号の質を改善するための技術です。スマートフォンや電話会議などの通信、また補聴器などでも応用されます。

音声認識: 音声波形から無言や雑音の部分を除き、発話を含む部分のみを選び出すことによって、音声データの質を向上させ、機械学習で扱いやすくさせます。さらに、認識された音声データをテキスト化することもできます。AIプロジェクトの予算や最終目的(翻訳プログラム、顧客サポート向けのチャットボットなど)によって、教師データの適切な形式はことなりますが、ご質問などございましたらお気軽に弊社にご相談下さい。自然言語処理を強みとし、20年のAIプロジェクト実績がございます。

感情分析: 音声の感情分析はコールセンターの業務改善、ラジオや音楽などに導入されます。音声解析は常に進化を続け、開発及び導入が進んでいます。国内ではコールセンターのオペレーターなどの音声解析サービスを提供しているEmpathEmotional Signatureのサービスがあります。

音声編集: 無言やノイズの部分を除去するなど、音声データの前処理を行います。音声編集の作業は、殆どの音声認識AIの研究開発の第一ステップとして必須です。例えば、音声強調を用いた通信器や録音データで相手の声を正確に聞き取るためには、音声編集を行い、ノイズ除去をします。

キーワード抽出: 音声データから特定のキーワードが発言されている時点を判定し、抽出します。キーワード抽出は、1つのものを表すために多種な言い回しが使われる場合(「東京ディズニーリゾート」、「TDR」、「ディスニー」など)に便利です。また、発話データの主なテーマを洗い出すためにも使われます(日常会話、ビジネス、スポーツなど)キーワード抽出は、音声アシスタントや文字起こしツールなどの裏で働いている自然言語処理技術の1つです。

音源分離: ノイズ除去や話者識別などのタスクにも音声解析は活用されます。音源分離とは、音声データの信号処理技術の1つであり、音声、複数話者、雑音などを分離することをいいます。また、ブラインド音源分離(ブラインド信号源分離)では、複数の未知の音源を分離することです。例えば、カーナビ技術の音声認識ではユーザーの発話と周りのエンジンの雑音などの音源分離を行うことによって、ユーザーの指示を聞き取り、対応することができるようになります。更に、音源分離は音声書き起こしや会議収録などのツールにも同じように活用されています。

音声合成: 音声合成は人間の声を人工的に作り出すことで、文章の読み上げやナレーションなどの目的で使われています。iPhoneの音声アシスタントやAIスピーカーから流れてくる音声も、音声合成によって作られたものです。また、コールセンターの自動音声、電子機器の案内、交通機関の案内放送などでも、音声合成は活躍されています。

音韻表記: 特殊な音声書き起こしの形態で、学会、言語学、心理学などの分野で使われます。単語の発音に特に焦点を置き、話者の発音方法を把握することを目的としています。発話された全ての音を音標文字で完全に列記したものが含まれ、声のトーンの上げ下げや音声ファイル内で異なる音がどのように重なっているかに関する音声アノテーションが含まれる場合もあります。詳しくは、こちらの音声書き起こしの記事もご覧ください。

 

音声解析サービス

当社開発の音声解析ツール

 

音声解析は、データ分析や業務効率化に繋がる音声AI向けの教師データを準備するための肝心なタスクですが、テキストや画像のデータ前処理作業と同様、音声解析も大変手間がかかってしまうことがよくあります。当社は音声データの書き起こしやアノテーションなどのサービスを提供し、AIの研究開発をサポートいたします。当社に在籍する100万人の言語学者やアノテーターは、厳しい選考プロセスを通過し、音声及びテキストの自然言語処理AIに関する20年もの経験を有しています。テキスト及び音声データを解析し、文字起こし会話分析などの関連サービスも提供しておりますので、プロジェクトのご相談や無料トライアルはこちらからお問い合わせください。

AI向け音声データの作成やアノテーションサービスを提供し、研究開発をサポートいたします。

メディア掲載結果

    AI・機械学習の最新情報をお届けします!

    Lionbridge AIのブログで紹介している事例記事やトレンドニュースといったビジネスに役立つ情報はもちろん、オープンデータセット集なども合わせてメール配信しております。