ニュース
カスタマーの発話認識精度が大幅に向上
「AmiVoice® Communication Suite」に
End-to-End型音声認識エンジンを追加
2026年6月30日、「AmiVoice Communication Suite」に、End-to-End型の音声認識エンジンを追加しました。カスタマー側の音声認識エンジンとして選択でき、従来のハイブリッド型エンジンと通話環境に応じて使い分けることが可能です。
コンタクトセンター業界における音声認識技術は、応対品質向上や業務効率化を支える重要な基盤として広く活用されています。一方で、カスタマー側の通話環境や発話特性は多様で、駅や街頭などの外出先、車内からの通話など環境騒音の影響を受けやすい状況に加え、スマートフォンの通信状況による音声の劣化、さらには不明瞭な発話など、認識精度に影響を与える要因が数多く存在します。そのため、こうしたさまざまな条件下においても安定した高い認識精度を実現できる音声認識技術へのニーズが高まっています。
そのような中、「AmiVoice Communication Suite」では、従来のハイブリッド型音声認識エンジンに加え、カスタマー側の音声認識エンジンにEnd-to-End型を新たに追加しました。End-to-End型は、騒音環境下や不明瞭な発話に対しても高い音声認識精度が期待できます。社内検証において、従来のハイブリッド型音声認識エンジンと比較し、認識エラー率が平均30.4%、最大37.8%と大幅に改善しました。※カスタマー側の通話環境に応じてハイブリッド型とEnd-to-End型を選択できるほか、カスタマー側にEnd-to-End型、オペレーター側にハイブリッド型を適用するなど、それぞれの特性を活かした柔軟な構成が可能です。
また、カスタマー側の音声認識精度の向上により、生成AIを活用した応対要約などの後続処理の品質向上と業務効率化が期待されます。さらに、単語登録機能も搭載しており、専門用語や固有名詞についても高精度なテキスト化を実現します。
End-to-End型は、音声認識エンジンの仕組みの一種です。「言語モデル」「音響モデル」「発音辞書」を活用して音声認識を行う従来のハイブリッド型エンジンと比較すると、単一のニューラルネットワークで音声認識を行うシンプルな構造です。一貫してEnd-to-Endモデル内で音声認識を行うため、認識精度の大幅な向上が期待されています。
※ 当社評価。12種類のコンタクトセンター向け評価データを用いた社内評価において、従来のハイブリッド型音声認識エンジンと比較した結果です。評価条件により結果は異なります。