ホームchevron_rightニュースchevron_rightトピックスchevron_right音声認識API「AmiVoiceⓇ API」のEnd to End音声認識エンジンに「単語登録」機能を追加

音声認識API「AmiVoice®API」のEnd to End音声認識エンジンに「単語登録」機能を追加

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」にて提供している、国内シェアNo.1のAI音声認識AmiVoiceを活用した音声認識API「AmiVoice API(アミボイス エーピーアイ)」で提供しているEnd to End方式の音声認識エンジンに、「単語登録」機能を追加しました。

これまで、「単語登録」機能は、ハイブリッド型の音声認識エンジンのみで提供していましたが、今回、End to End方式の音声認識エンジンも対応することで、より利便性を高め、多くのユーザーに快適にご利用いただけるようにしました。
音声認識において単語登録は、専門用語や固有名詞の認識精度向上に大きく寄与する重要な機能であり、実際に多くのお客様から要望が寄せられていました。本機能の追加により、ユーザーは認識させたい専門用語や固有名詞をあらかじめ登録することで、より高精度にテキスト化することが可能になります。
現在、End to End方式の音声認識エンジンは、コンタクトセンターでの会話の文字起こしや、ボイスボットにおける数字や短い発話の認識などの用途で特に多くのお客様にご活用いただいております。今回、「単語登録」機能に対応したことで、これまで固有名詞や専門用語への対応を理由に導入をためらわれていた用途でも、採用しやすくなりました。

なお、「AmiVoice API」にて提供しているEnd to End方式の音声認識エンジンは、日本語・中国語・多言語(日・英・中を単一エンジンで認識)の汎用向け音声認識エンジンです。「単語登録」機能は、これら全ての音声認識エンジンでご利用いただけます。

「単語登録」機能を追加したEnd to End方式の音声認識エンジン一覧

エンジン

認識方法内容
日本語_汎用
リアルタイム
バッチ
会議、コンタクトセンターなどの通話、取材、放送、スピーチなど、会話の文字起こしに適したエンジン。
中国語_汎用
(簡体字、中国本土)
リアルタイム
バッチ
中国語の文字起こしや音声入力に適した音声認識エンジン。
多言語対応
(日・英・中)
リアルタイム
バッチ
日本語・中国語・英語の3つの言語を単一エンジンで認識。話者の言語を音声認識し適切な言語にテキスト化。

End to Endは、音声認識エンジンの仕組みの一種です。「言語モデル」「音響モデル」「発音辞書」を活用して音声認識を行う従来のハイブリッド型エンジンと比較すると、単一のニューラルネットワークで音声認識を行うシンプルな構造です。一貫してEnd to Endモデル内で音声認識を行うため、認識精度の向上や処理速度の高速化が期待されています。

アドバンスト・メディアでは、今後もお客様の業務課題や利用シーンに即した機能強化を通じて、音声認識サービスの利便性・実用性向上に取り組んでまいります。

「AmiVoice Cloud Platform」について

「AmiVoice Cloud Platform」は、国内シェアNo.1のAI音声認識AmiVoiceを提供する開発者向けボイステックプラットフォームです。お客様が開発するサービスのシステム要件・セキュリティ要件に合わせて、クラウド環境で利用できる音声認識API「AmiVoice API」、お客様専用環境で利用できる「AmiVoice API Private」、スタンドアローンで利用可能な「AmiVoice SDK」の3つのプランから選択いただけます。
https://acp.amivoice.com/

※出典:合同会社ecarlate「音声認識市場動向2025」音声認識ソフトウェア/クラウドサービス市場

本件のお問い合わせ

PF D&O部
この製品についてのお問い合わせ

経営推進本部 広報チーム
この報道内容についてのお問い合わせ

国内シェアNo.1国内シェアNo.1AmiVoiceⓇAmiVoiceⓇ

※出典:合同会社ecarlate「音声認識市場動向2025」
音声認識ソフトウェア/クラウドサービス市場

声で書く、声で動かす。
AI音声認識AmiVoiceは、
さまざまなビジネスシーンで、
人とキカイの自然なコミュニケーションを実現する技術です。