ニュースリリース

事前学習なしで音声から発話者を推定する「話者ダイアライゼーション」が、リアルタイム認識でも音声認識APIの無料オプションとして利用可能に

2023/02/01
トピックス

開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」で提供しているAmiVoice APIの無料オプション「話者ダイアライゼーション」機能がリアルタイム認識でも利用できるようになりました。

 

 

話者ダイアライゼーションは、複数の話者が含まれる音声に対して、誰がいつ話したのかを推定する技術です。アドバンスト・メディア独自開発の音響モデルを用いて、事前学習なしで音声から発話者を推定し、発言内容と発話者を自動的に紐づけます。会議や対面営業、面談、動画への字幕付与など、複数人が話をするシーンでご利用いただけます。

従来はバッチ認識でしか利用できませんでしたが、この度、リアルタイム認識でも利用できるようになりました。
音声ファイルをテキスト化する場合だけでなく、発話と同時に音声認識処理を行う場合でも話者ダイアライゼーション機能を利用することが可能になります。

 

AmiVoice APIの特長

1. 音声認識市場シェアNo.1。日本語・専門用語に強いエンジン
AmiVoiceは25年以上のノウハウ・データが蓄積された高精度かつ高速の音声認識エンジンです。ビジネスシーンや専門性の高い作業現場など幅広いシーンで使われています。

2. 1時間99円から。低価格で高品質な音声認識を利用可能
録音された時間ではなく発話のあった時間のみの従量課金制。課金単位も1秒単位で切り上げ計算なし。1時間99円(税込)~と、業界最低価格でありながら高品質な音声認識エンジンをご利用いただけます。

3. 業界や用途に合わせて選べるエンジンで高い認識率を実現
様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。利用シーンに合わせてエンジンを選ぶことで認識率が大幅に向上します。
また、すべての音声認識エンジンを毎月60分無料でお使いいただくことができます。

■AmiVoice API 詳細
https://acp.amivoice.com/amivoice_api/

 

AmiVoice Cloud Platformとは

音声認識を中心とした音声関連技術を提供する開発者向けボイステックプラットフォームです。国内シェアNo.1の高精度かつ高速なAI音声認識AmiVoiceを、業界最安値の1時間99円(税込)~で利用できる「AmiVoice API」に加え、音声認識開発キット「AmiVoice SDK」を提供。クラウド/オンプレミス、リアルタイム/バッチなど、目的に合わせて最適なインターフェイスを選択できます。
また、Amazon Connectを利用したコンタクトセンター製品開発者向けサービスもご利用可能です。

■AmiVoice Cloud Platform 詳細
https://acp.amivoice.com/

※出典:ecarlate「音声認識市場動向2022」音声認識ソフトウェア/クラウドサービス市場

本件のお問い合わせ

PF D&O部