よくある質問一覧
音声認識について
音声認識は、「音響モデル」「辞書」「言語モデル」という3つのデータベースを組み合わせて動作しています。
当社ではこれらのベースデータをあらかじめご用意しています。
多くの場合は標準のままご利用いただけますが、コールセンター特有の音声や会話内容を学習させることで、より高精度な音声認識を実現することも可能です。
一般的に、コールセンターのオペレーターのように丁寧で明瞭な話し方の場合、平均90〜95%以上の認識率になります。一方、お客様側の発話や内線通話など、くだけた話し方では80〜90%程度が目安です。
実際に話された内容と、音声認識結果のテキストを比較して算出します。
1文字1文字がすべて一致すれば100%となり、文字の挿入・削除・置換が発生すると認識率が下がります。
例えば「お世話になります」を「お世話になりました」と認識した場合、正解文字数8文字に対して「す」→「し」への置換が1文字、「た」の挿入が1文字となり、認識率は(8-1-1)÷8=75%になります。
人の耳でも聞き取りにくい小さな声や不明瞭な話し方、「ありがとうございました」を「あざーした」と省略する発話、強いノイズが含まれる音声は、正確な音声認識が難しくなります。
はい、可能です。専門用語や固有名詞は「単語登録」を行うことで音声認識できるようになります。単語登録はお客様ご自身で簡単に行えます。
イントネーションの違いは問題なく認識可能です。ただし、「ありがとう」を「おおきに」と言うなど、方言特有の単語や言い回しについては、単語登録や音声認識エンジンへの学習が必要になります。
対応言語については個別にご案内しております。詳細はお問い合わせください。
以下の方法で認識率向上が期待できます。
■単語登録
専門用語や社内用語を登録することで精度が向上します。単語登録はお客様で簡単に行えます。
■音声認識エンジンの個別チューニング
お客様のコンタクトセンターでの会話内容を当社専門スタッフが音声認識エンジンに学習させることで、認識率を向上させることができます。
■運用面の工夫
下記に注意することで、認識率を上げることができます。
はっきりと明瞭に話す
録音音量を適切に設定する
ヘッドセットと口元の距離を適切に保つ
「音響モデル」「辞書」「言語モデル」のうち、「辞書」については、単語登録機能としてユーザー側で登録可能です。認識されない単語の表記と読み(ひらがな)を登録することで、音声認識できるようになります。
はい、感情解析機能は標準で実装しています。
トライアルについて
はい、少数席でのPOC(検証導入)が可能です。また、すでに録音済みの音声データをお預かりして音声認識を試すこともできます。詳細はお問い合わせください。
最初に電話環境や業務運用のヒアリングを行い、最適なシステム構成をご提案します。
その後、システム導入・操作説明を経て稼働開始となります。
通常、稼働開始までの期間は数週間〜数カ月程度です。
費用について
はい、月額利用料制のサービスをご用意しています。詳細はお問い合わせください。
はい、可能です。ご予算や規模に応じた最適なご提案をいたします。詳細はお問い合わせください。
専用のお問い合わせフォームよりご連絡ください。
生成AIについて
通話終了後に自動で要約を生成します。また、通話中要約機能では、管理者が応対中のオペレーターの通話内容を任意のタイミングで要約することが可能です。
セキュリティ要件に応じて、ローカル環境で利用できるローカルLLMや、クラウド型の生成AIを選択できます。ローカルLLMは通話データを外部のクラウドへ送信する必要がなく、社内ネットワーク内で安全に処理が可能です。機密性の高い顧客情報や通話内容も、データの外部流出リスクを抑えた運用ができます。
はい、用途に応じてクラウドLLMとローカルLLMを使い分けたり、両者を組み合わせたハイブリッド運用が可能です。
はい、既存の録音データやPOC環境を使って、生成AIによる要約や情報抽出の効果を事前に確認できます。詳細はお問い合わせください。
その他
AmiVoice Communication Suiteは、コンタクトセンターの会話に特化した音声認識エンジンを採用しています。600社以上の導入実績で培った豊富な学習データを活用し、通話内容を高精度にテキスト化できます。
また、お客様の業務内容や通話特性に合わせた個別チューニングにも対応しており、音声認識精度をさらに高めることが可能です。加えて、生成AIを活用した通話内容の要約やQ&A生成、顧客情報の自動抽出にも対応しています。セキュリティ要件に応じて、ローカル環境で利用可能なローカルLLMと、最新のクラウドLLMを使い分けることができ、両者を組み合わせたハイブリッド運用も可能です。
はい、可能です。一般的な.wav形式で音声ファイルを取り出せれば音声認識できます。
ただし、強い圧縮やモノラル録音の場合は認識率が低下することがあります。
音声認識には音声の録音が必要です。電話環境に応じた最適な録音方式をご提案します。
はい、APIを通じたシステム連携が可能です。様々なAPIをご用意しているので、幅広い用途での連携が可能です。通話日時、話者情報、音声認識結果などの情報を外部システムと連携して取り出すことができます。
はい、シンクライアントや電話構成に合わせたシステム構成をご提案可能です。詳細はお問い合わせください。
クラウド型・オンプレミス型の両方に対応しています。また、リアルタイム処理とバッチ処理のいずれも選択可能です。お客様のご要望や環境に合わせて、柔軟に構築ができます。詳細はお問い合わせください。
はい、リアルタイム処理とバッチ処理の共存が可能です。
はい、電話環境や録音方式によって認識率は変動します。
環境に合わせた最適な構成をご提案しますので、まずはご相談ください。
はい、クラウドサービスとして提供しています。お客様が契約されているクラウド環境への構築も可能です。
AmiVoice がコンタクトセンターの
悩みをすべて解決します!
どんなことでもお気軽にお問い合わせください。
