よくあるご質問 | 音声認識のアドバンスト・メディア

AI音声認識AmiVoiceについて

AmiVoiceは国内シェアNo.1^※のAI音声認識です。
※出典：合同会社ecarlate「音声認識市場動向2025」音声認識ソフトウェア/クラウドサービス市場

AmiVoiceの特長についてはこちらをご覧ください。

誰の声でも認識します。発音の明瞭度、喋り方、声の大きさなどによって認識率は多少左右されます。

イントネーションの違いや発話スピードの緩急に対応しています。ただし、辞書に入っていない方言については新たに登録をする必要があります。

AmiVoiceは前後の単語を見ながら認識結果を出していますので、文の途中で発話を区切ると誤認識の原因となります。
できるだけ一文単位で発話するように心がけてください。

以下のヒントを参考にしてください。

明瞭な声ではっきりと発話してください
一文もしくは句読点を目安に発話してください。複数の文節が入力されたとき、日本語文脈の解析がより効果的に働きます。
ディクテーションでは、マイクから入力されるすべての音が日本語の文章として解析されます。
途中で言い直したり、”えーと”や”んー”などの発言は、文脈の中での単語と見なされます。

音響的モデルと言語的モデルで計算した確率の最も高い単語列を認識結果としており、音声から直接漢字仮名交じりの認識結果を得ています。
音声認識では、平仮名を認識してから漢字に変換しているのではありません。

平仮名一文字ずつの認識は、誤認識が多く発生するため実用化しておりません。

音声認識の基本的な仕組みについてはこちらをご覧ください。

音声認識の歴史はこちらをご覧ください。