ページの本文へ

Hitachi

サイト名称

音声データには「話し言葉」が多数混在して活用しづらい

音声認識システムを導入するも、音声データをテキスト化すると、下記のような課題が発生します。

テキスト化の課題

このように、音声には笑い声や挨拶、「あのー、そのー」といった「話し言葉」や、「いつもお世話になります」といった定型文が含まれ、実際にデータを活用しようとすると非常に手間がかかることがあります。

不要な発話を自動除外、重要な発話を自動判別

このような課題を解決するには、音声をテキスト化したデータから不要な発話を自動的に除外し、さらに、重要な発話を自動判別するような仕組みが必要となります。このような仕組みが実現すれば、音声データの活用がより効率よく、そして確実なものとなります。

課題解決の仕組み

発話の自動除外・自動判別実現するシステム

上記のような仕組み(不要な発話の除外と重要な発話の判別)を自動的に行うのが、下記のシステム(CoreExplorerとKNIME)です。このようなシステムを構成することで、御社の音声データの課題を解決できます。

課題解決の仕組み

上記のシステムでは、抽出型要約技術により要約文を作成します。音声テキストデータに含まれる言いよどみや定型的な不要文の削除、また機械学習の技術を使い、既存のFAQや過去の問合せ、マニュアルなど業務に関わる情報を取り込むことで重要文を判断し抽出し要約します。

主な処理順番とその概要は下記の通りです。

処理順番 処理内容 使用技術
フィラーの削除 「あ~」「その」などの言いよどみなどを削除 ルールベース
フィラー、感動詞判定
不要文削除 「もしもし」「かしもまりました」などの定型文を削除 教師あり
機械学習
重要文抽出 残った文章のなかからコーパスを元に重要文を自動学習した文章を抽出 教師なし
機械学習
要約文作成 処理レベルに応じた削除、抽出を行った要約文書を作成。

本格導入をご検討いただくためのPoCサービス

このようにCoreExplorerとKNIMEを活用すれば、御社の音声認識データの活用課題を解決することができます。実際に導入をご検討いただける場合は、PoCサービス(検証サービス)をご用意しておりますのでぜひご検討ください。

PoCサービス(検証サービス)では、本格導入前に動作検証を行い、御社の活用目的にあったチューニングを行います。そしてその結果を判断材料に、導入のご検討を進めていただくことができます。

PoCサービスの想定スケジュール

PoCサービスの想定スケジュール

PoCサービスを実施するにあたりご準備いただくデータ

データの種類 主なデータ 必要な情報
音声テキストデータ 音声認識システムから出力された音声テキストデータ
  • 1つの通話を特定するキー情報
  • 発話された時間
  • 発話者の区分(オペレータ、カスタマーなど)
  • 発話された内容のテキスト情報
※テキスト化の精度は、人が読んで問い合わせ内容が理解できるレベルが望ましい
学習用コーパス FAQ、製品マニュアル、応対マニュアル、トークスクリプト、ホームページコンテンツ、など。 お客様固有の情報が記載されているテキストデータ。音声テキストデータに含まれる内容の情報。
評価用正解データ 音声テキストデータに対して、”重要”と判定したデータ
また、明らかに”不要”と判定したデータ
要約の結果の正しさを判定するため、音声テキストデータにおいて、どの文が要約結果として抽出されると正しいかの評価用正解データを作成いただく

PoCサービスのオプション

サービス名 内容 費用
自動分類PoCサービス 要約結果や、その他テキストデータを教師あり機械学習で自動分類、評価を実施 別途後相談
固有表現抽出PoCサービス 音声テキストデータから、電話番号、製品名、名前、住所などの固有表現を抽出、評価を実施 別途後相談
テキスト分析支援サービス 要約結果や自動分類結果をテキストマイニングシステムCoreExplorerを利用し、テキスト分析作業を支援 別途後相談

本格導入をご検討いただくためのPoCサービスの資料請求・お問い合わせ

PoCサービスの資料請求やお問い合わせは下記よりお願いいたします。

お問い合わせ・資料請求

テキストマイニングシステム「CoreExplorer」に関する
資料請求・お問い合わせはこちら

資料請求・お問い合わせ

セミナー/展示会