よくある質問

アドバンスト・メディアに寄せられるよくあるご質問をまとめました。
各製品についてのご質問は下記入り口からご確認ください。

コンタクトセンターについてのご質問

クリックで解答が表示されます。
音声認識の活用方法について
Q1. 音声認識して文字化された文章を、どう活用するのでしょうか?
A1

例として、以下のような活用方法があります。

■オペレーターの活用方法例

  • オペレーターやお客様の喋った内容に応じて適切な情報を自動的に画面上に表示することができます
  • 好ましくない発言や口癖などを自動的に検出することができます
  • 自身の通話を文字を見ながら聞き返したり、頭出し再生ができます

■スーパーバイザーの活用方法例

  • 文字を使って複数のオペレーターを同時に監視することができます
  • クレームに繋がる可能性のある通話を自動的に検出できます

■マーケティング部門の活用方法例

  • 通話からVOCを抽出し商品開発へのフィードバックが可能です
Q2. 音声認識した結果の分析はどうやるのですか?
A2

テキストマイニング可能な他社ツールと多数の連携実績がございます。用途に応じてご提案・ご紹介させていただきます。

音声認識について
Q3. 音声認識をするには何が必要ですか?
A3

音声認識には「音響モデル」「辞書」「言語モデル」という3つのデータベースが必要です。
この3つは当社でベースのものをご用意いたします。
ベースのものをそのままご利用いただくこともできますが、お使いのコールセンター環境の音声や言語データを学習させることでより精度の高い音声認識をすることが可能になります。

Q4. 認識率はどのくらいですか?
A4

一般的にはコールセンターのオペレーターなど丁寧な喋り方をする方の場合は平均80%~95%程度になり、内線通話やお客様側などくだけた喋り方の場合は平均50%~80%程度になります。

Q5. 認識率の計算方法は?
A5

喋った内容と音声認識結果を比較することで計算します。1字1句すべて一致したら100%となりますが、誤って文字が挿入/削除/置換されると認識率が下がります。
例えば、「お世話になります」と言ったのを「お世話になりました」と音声認識した場合は、正解文字数8文字に対して「す」→「し」への置換が1文字、「た」の挿入が1文字となり、認識率は(8-1-1)÷8=75%になります。

Q6. 音声認識できないのはどういう音声ですか?
A6

文字にできないようなぼそぼそとした喋り方や、「ありがとうございました」を「あざーした」のように文字を飛ばす喋り方、また、音に大きなノイズが含まれている場合は音声認識することが困難です。

Q7. 専門用語は音声認識できますか?
A7

どんな専門用語でも音声認識エンジンに学習させることで音声認識可能になります。

Q8. 方言は認識できますか?
A8

イントネーションの違いは全く影響なく音声認識が可能です。ただし、方言特有の単語や言い回し(例:「ありがとう」⇒「おおきに」など)は音声認識エンジンに学習させる必要があります。

Q9. 音声認識できるのは日本語だけですか?
A9

詳しくはお問い合わせください。

Q10. どうすれば認識率が上がりますか?認識率を上げるコツはありますか?
A10

■音声認識エンジンの学習
電話で喋る内容を当社専門スタッフが音声認識エンジンに学習させます。そのために、通話を録音した音声をお預かりしたり、業務マニュアルやトークスクリプト、用語集や商品名・支店名などの一覧をお預かりします。また、単語登録機能があるので、音声認識しない単語をご利用されるユーザー様自身で登録することも可能です。

 

■利用する上でのコツ
下記に注意することで認識率を上げることができます。

  • はっきりとした明瞭な喋り方をする
  • 録音ボリュームを適切に調整する
  • 受話機・ヘッドセットを口に近づけて喋る
Q11. ユーザー側で音声認識エンジンの学習はできますか?
A11

音声認識エンジンが持つ「音響モデル」「辞書」「言語モデル」という3つのデータベースのうち、「辞書」はユーザー側で登録をすることができます。
音声認識できない単語の表記と読み(ひらがな)を辞書へ登録することで音声認識が可能になります。

Q12. 使う前に声の学習は必要ですか?
A12

声の学習は不要です。誰でもすぐにお使いいただけます。

Q13. 感情分析はできますか?
A13

標準で実装しております。

競合について
Q14. 他社の音声認識とどう違うの?
A14

AmiVoice Communication Suiteのコンタクトセンター専用ベースエンジンには、業界シェアNo.1を誇る300社以上の膨大なリソースが蓄積されており、非常に高い精度で音声をテキスト化することができます。お客様ごとの個別チューニングで、更に音声認識精度を上げることも可能です。

システム構成について
Q15. 既に通話を録音していますが、その音を音声認識できますか?
A15

一般的な形式の音声ファイル(.wavなど)として取り出すことができれば可能です。
音声データを強く圧縮したり、オペレーター側/お客様側の音を混ぜた場合(モノラル録音)は認識率が低下します。

Q16. 通話を録音していないんですが、使用できますか?
A16

音声認識のご利用には音声の録音が必要になります。電話環境に応じた録音方式をご提案いたします。

Q17. 他のシステムと連携は可能ですか?
A17

はい。APIを通じて情報連携が可能です。
通話の情報(日時・話者など)や音声認識結果などの情報を取り出すことが可能です。

Q18. シンクライアント環境に導入可能ですか?
A18

シンクライアントや電話の構成に合わせてご提案いたします。
詳しくはお問い合わせください。

Q19. システム構成を教えてください。
A19

リアルタイム処理とバッチ処理、オンプレミス利用とクラウド利用をご用意しております。
お客様のご要望や環境に合わせて、柔軟に構築可能です。詳細につきましては、お問い合わせ下さい。

Q20. リアルタイム処理とバッチ処理の共存は可能ですか?
A20

はい。可能です。

Q21. 電話の環境によって、認識率は変わりますか?
A21

電話の環境や、音声の録音方式によって音声認識率は変動します。
環境に合わせて最適なご提案をいたします。まずはお問い合わせください。

Q22. AmiVoice Communication Suiteのクラウド環境での提供はありますか?
A22

はい、クラウドでの提供も可能です。

トライアル・導入について
Q23. トライアルは可能ですか?
A23

デモ環境のお貸出や、既に録音している音声をお預かりして音声認識を試すことが可能です。
まずはお問い合わせください。

Q24. システム稼働までのプロセスと期間を教えてください。
A24

まずは電話環境や業務運用のヒアリングをし、最適なシステム構成をご提案いたします。
その後、音声認識エンジンの構築を経て、システム導入・操作説明を実施し、稼働開始となります。
通常はシステム稼働まで3ヶ月~半年程度です。

Q25. 導入の際にユーザーで準備が必要なことはありますか?
A25

音声認識エンジンの構築のために、通話音声や専門用語集や、トークスクリプト集などをご準備ください。

費用について
Q26. 月額利用料制のサービスはありますか?
A26

あります。詳しくはお問い合わせください。

Q27. 5席のコールセンターでも導入できますか?
A27

はい。予算に応じたご提案をさせていただきます。

Q28. 購入方法を教えてください。
A28

こちらからお問い合わせください。