デジタルヒューマンに国内シェアNo.1を誇る音声認識エンジン「AmiVoice®」を搭載しました

2022.06.30

デジタルヒューマン株式会社（本社：兵庫県芦屋市 / 代表取締役：荒尾和宏）は、音声認識市場シェアNo.1、高精度かつ高速の音声認識エンジンでまったく新しいコミュニケーションを提供する、株式会社アドバンスト・メディア（本社：東京都豊島区 / 代表取締役会⻑兼社⻑鈴⽊清幸）の開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」の⾳声認識API「AmiVoice API」を「デジタルヒューマン」に搭載したことをお知らせします。

アドバンスト・メディアの「AmiVoice」は、20年以上のノウハウ・データが蓄積された高精度かつ高速の音声認識（※1）エンジンで、国内の音声認識市場シェアNo.1（※2）を誇ります。一般的な日本語はもちろん、専門用語の認識にも強く、医療分野やコンタクトセンターをはじめ、数多くの導入実績を持っています。開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」にて、AmiVoiceのAPIやSDKを提供しており、2019年12月の提供開始以来、利用者数は累計1,600ユーザー以上に達しています。デジタルヒューマンとの連携は、このプラットフォームの音声認識API「AmiVoice API」を活用して開発されました。

>>「AmiVoice Cloud Platform」について

https://acp.amivoice.com/

「デジタルヒューマン」はAIの顔で、映画やゲームで利用出来る品質のリアルなCGキャラクターと対話することができるAI アバターです。AIやチャットボットと連携して、顔の表情やリップシンク（セリフと唇の同期）したアバター映像をリアルタイムに生成して配信します。

デジタルヒューマンは、メタバースや顧客接点DXの大本命として、また人に代わって労働力を提供する新たなデジタルワークフォースとして期待されています。

>>「デジタルヒューマン」について

https://www.digitalhumans.jp/

■ 概要

この度、市場シェアNo.1の⽇本語、専⾨⽤語に強い音声認識エンジンAmiVoiceが「デジタルヒューマン」へ搭載され、下記の事が実現できるようになりました。

1．単語登録機能で製品名・固有名詞などの認識も可能に

「AmiVoice API」に製品名・固有名詞など、認識させたい単語を登録することができます。これにより、デジタルヒューマンとの対話において、社内用語や氏名など、特定の単語やフレーズの認識精度が向上します。

2．「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンが利用可能に

利用シーンに合わせてエンジンを選ぶことで、認識率が大幅に向上します。言語モデルを使い分けることで、医療や製薬、保険、金融等の専門用語をデジタルヒューマンが理解出来るようになります。

https://acp.amivoice.com/amivoice/#engine

3．「えーっと」「あのー」などの言い淀みを自動削除

「えーと」「そのー」「あの」などの言い淀み（フィラー）があった場合にデジタルヒューマンが誤認識してしまうこともありましたが、「AmiVoice API」が自動削除するようになります。また、句読点と疑問符も自動的に付与し、より正確でわかりやすい話し言葉として認識するようになります。

4．ビジネスユースに特化した言語フィルタリング

「AmiVoice API」は、業務やビジネスで使用することのない不適切な用語や、有害な用語の省かれたビジネスユースに強い言語モデルを使用しています。このため、ビジネスに最適な音声認識をデジタルヒューマンがおこなうようになりました。

日本国内でも大手金融機関や小売業、コンタクトセンターを中心に導入がはじまっています。

デジタルヒューマン株式会社は、リアルAIアバターなどの先端技術やサービスを活用した新たなソリューションをお客様に提供してまいります。

■ デジタルヒューマン株式会社

デジタルヒューマンは、会話の内容に合わせて、顔の表情、声のトーン、唇の動き（セリフと同期するリップシンク）、ヘッドモーション、ボディモーション、マイクロアイモーション（眼球運動）が変化するスピーチアニメーション画像をリアルタイムに生成します。日本語に対応した音声認識機能を備え、相手の個人特定、感情分析、年齢や性別の分析など、新たな機能も続々リリース予定です。

所在地：兵庫県芦屋市船⼾町5-26 マリアキャリーヌビル2F

代表取締役：荒尾和宏

Webサイト：

https://www.digitalhumans.jp/

・（※1）音声認識：人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能で、speech recognitionや、Speech-to-Text（STT）とも呼ばれています。

・（※2）出典：ITR「ITR Market View : AI市場2021」音声認識市場ベンダー別売上金額シェア（2015～2021年度予測）

・「AmiVoice」は株式会社アドバンスト・メディアの登録商標です。

以上

本件のお問い合わせ

経営推進本部　広報チーム

PF D&O部