よくある質問

アドバンスト・メディアに寄せられるよくあるご質問をまとめました。
各製品についてのご質問は下記入り口からご確認ください。

音声認識AmiVoiceについてのご質問

クリックで解答が表示されます。
AmiVoiceの音声認識技術について
Q1. AmiVoiceの特長は?
A1

AmiVoiceは様々な利用用途、分野、環境に対応可能です。

  • 携帯電話やPCなど多くのプラットフォームに対応可能です
  • サーバー型、スタンドアローン型のどちらの認識方式にも対応可能です
  • 電話音声や車内音声、工場内などの騒音下での音声など、多くの環境に適した音響モデルを所有しています
  • 医療ドキュメント作成やコールセンター通話記録、日報作成など、多くの業界や利用シーンに適した言語モデルを所有しています
Q2. 誰の声でも認識しますか?
A2

誰の声でも認識します。発音の明瞭度、喋り方、声の大きさ等によって認識率は多少左右されます。

Q3. イントネーションの違いや方言は大丈夫ですか?
A3

イントネーションの違いや発話スピードの緩急に対応しています。ただし、辞書に入っていない方言については新たに登録をする必要があります。

Q4. 単語ごとに発話すると誤認識が多いのですが…
A4

AmiVoiceは前後の単語を見ながら認識結果を出していますので、文の途中で発話を区切ると誤認識の原因となります。できるだけ一文単位で発話するように心がけてください。

Q5. ディクテーションを行う場合のヒントを教えてください。
A5

以下のヒントを参考にしてください。

  • 明瞭な声ではっきりと発話してください
  • 1文もしくは句読点を目安に発話してください。複数の文節が入力されたとき、日本語文脈の解析がより効果的に働きます
  • ディクテーションでは、マイクから入力されるすべての音が日本語の文章として解析されます。途中で言い直したり、”えーと”や”んー”等の発言は、文脈の中での単語と見なされます
Q6. 漢字変換はどのようにしているのですか?
A6

音響的モデルと言語的モデルで計算した確率の最も高い単語列を認識結果としており、音声から直接漢字仮名交じりの認識結果を得ています。 音声認識では、平仮名を認識してから漢字に変換しているのではありません。

Q7. 平仮名で一文字ずつでもよいので入力させたいのですが。
A7

平仮名一文字ずつの認識は、誤認識が多く発生するため実用化しておりません。

声紋認証技術について
Q8. バイオメトリクスとは?
A8

バイオメトリクスとは個人の肉体的や行動の特徴情報を測定・数値化したデータを個人認証に利用する技術です。声をバイオメトリクス認証に使う技術に声紋認証があります。

Q9. 声紋認証と声紋識別の違いは?
A9

声紋認証は、声を使い、登録者本人か判定します。
声紋識別は、多人数の声紋データベースの中から、入力された声が誰であるか特定します。

Q10. バイオメトリックシステムの精度はどのように表現されるのか?
A10

本人か否かを判断するためのある条件に対して、他人受け入れ率と本人拒否率の2つの側面を用い、これらの指標を緩めから厳しめと条件を変えながら、描いたカーブを照合精度特性と呼び、バイオメトリックシステムの精度を比べる際に用います。

  • 他人受入率:他人が誤って本人判断し受け入られた率
  • 本人拒否率:本人を誤って他人判断し拒否された率
Q11. 声紋認証と音声認識の違いは?
A11

声紋認証は、声から本人かどうか判定する技術です。
音声認識は、声から言葉の内容を文字化する技術です。

Q12. 声紋認証の優位性は何?
A12

以下の点において優位性があります。

  • 非接触性:声紋認証は、声で行うバイオメトリクス認証なので、入力装置に触れず、ハンズフリーでの利用も可能です
  • 特殊な装置不要:声紋認証は、指紋認証や静脈認証のような特殊な読取装置は必要ありません。携帯電話や市販されているマイクなど普及されている機器と組み合わせることで容易に実現できます
  • 電話機との親和性:声紋認証は、入力装置がマイクとなるため、携帯電話や固定電話を活用したシーンでのバイオメトリクス認証に適しています