よくある質問

アドバンスト・メディアに寄せられるよくあるご質問をまとめました。
各製品についてのご質問は下記入り口からご確認ください。

議事録・書き起こしについてのご質問

クリックで解答が表示されます。
マイクについて
Q1. 集音マイクやICレコーダーからの音声は認識可能ですか?
A1

机の真ん中・天井に取り付けた集音マイクやICレコーダーを置いて複数人の声を収録する場合では音声認識は困難です。
※口元で録音したICレコーダーの音声は音声認識可能です。

Q2. マイクは指定のものでなければならないのですか?
A2

音声を明瞭に録音することができる指向性マイクであれば、特に指定はございません。
マイク設備をお持ちでない場合は、お客様の会議の運用に合わせたマイク設備も併せてご提案させて頂きます。

Q3. 同時に発言した場合は認識できますか?
A3

通常複数のマイクをミキサーにて1つの音声に集約をする為、同時に発言した場合は、誤認識となる可能性が高まります。
しかし、音声データとしては録音されておりますので、編集ソフトのAmiVoice Rewriterを用いて編集することで、誤認識箇所を音声再生しながら効率的に修正して頂くことができます。

Q4. マイクの本数分のライセンスが必要となるのでしょうか?
A4

マイクの本数分のライセンスが必要となるわけではございません。
最小構成としては、下記となります。

  • 録音認識ソフト AmiVoice Recorder     1ライセンス
  • 編集ソフト AmiVoice Rewriter       1ライセンス
  • 言語モデルカスタマイズ(音声認識用辞書)  一式
ソフトウェアについて
Q5. 会議が2部屋で同時開催される場合、AmiVoice Recorderは2ライセンス必要ですか?
A5

会議の最中に2部屋分リアルタイムに音声認識処理を行う場合はAmiVoice Recorderは2ライセンス必要となります。
一方、1部屋はAmiVoice Recorderを用いてリアルタイムに音声認識処理を行い、もう1部屋については会議終了後にマイクを通じで録音したデジタル音声ファイル(wma,wav,mp3等)をAmiVoice Recorderを使って後から音声認識処理を行う運用であれば、AmiVoice Recorderは1ライセンスで利用できます。

Q6. 認識率はどのくらいですか?
A6

会議の内容や発話者、録音環境により変化いたします。
また、人間が聞いても聞き取れない発言の場合は認識精度は低下します。
整然と発言される傾向が強い議会では90%以上の認識率となっていますが、通常の会議や委員会の場合の認識率は60%~85%程度となります(マイクとの位置関係によっても異なります)。
認識率の高低は当システムでも非常に重要な位置を占めます。認識結果に関わらず、編集ソフトの「AmiVoice Rewriter」を活用することにより、効率的な議事録作成が可能となる点が大きな特徴です。

Q7. 方言は認識できますか?
A7

イントネーションやアクセントの違いに関しては問題なく認識ができます。
地域特有の話題・固有名詞・地名等は過去の議事録をお預かりして認識ができるように事前にカスタマイズします。
当社では北は北海道から南は鹿児島まで全国の自治体様、民間企業様でご利用頂いております。

Q8. トライアルは可能でしょうか?
A8

お客様のご要望に応じて1カ月程度トライアルを行っていただくことは可能でございます。詳細についてはお問い合わせください。

Q9. AmiVoiceSP2(個人用音声認識入力ソフト)との違いは何ですか?
A9

AmiVoice SP2では汎用的な音声認識エンジンを利用していますが、議事録作成支援システムではお客様ごとに音声認識エンジンを作成いたします。また、話者名や時間情報が付与されるなど、議事録作成に特化したソフトウェアとなっております。

Q10. 編集ソフトのみの利用は可能でしょうか?
A10

はい。可能です。編集ソフトのみを使っても書き起こしの効率化につながるため、複数の団体様で編集ソフトのみご利用いただいております。

Q11. VoXTとはどのように違うのですか?
A11

VoXTは録音ファイルの認識とリスピークが使用でき、音声認識エンジンは汎用エンジンを使用しています。議事録作成支援システムはリアルタイム認識に対応しており、音声認識エンジンもお客様ごとにカスタマイズしております。

Q12. スタンドアローンタイプはありますか?
A12

議事録作成支援システムはスタンドアローンです。音声認識サーバーを利用したASPサービスもございます。

Q13. イニシャルコストを抑えたいのですが
A13

イニシャルコストを抑えたレンタルプランやASPサービスをおすすめいたします。詳しくはお問い合わせください。

Q14. 要約の議事録を作成したいのですが、要約は可能でしょうか?
A14

基本的に一言一句音声認識でテキスト化いたします。要約する場合は編集ソフトを用いて要約の議事録を手動で作る必要があります。

Q15. スタンドアローンとASPの違いは何ですか?
A15

スタンドアローンはネットワークを介さずに、PCのみで利用が可能です。ASPサービスは弊社サーバーに音声ファイルをアップロードするため、ネットワーク環境が必須です。

Q16. 自治体以外ではどういった企業が導入していますか?
A16

金融機関、教育機関、医療機関などの経営会議、取締役会等、重要な会議や、講義録の作成など様々な場面で使用していただいています。
詳しくは導入事例 をご覧ください。

Q17. バッチ認識は音声ファイルの指定はありますか?
A17

録音された音声ファイルをまとめて認識にかけることも可能です。精度を優先するか速度を優先するかなどいくつかのパターンを選択可能です。

Q18. インタビュー、セミナー等でも使用したいのですが?
A18

口元がマイクに近い環境で録音された音声であれば問題ありません。実際にインタビューやセミナー用途でお使いいただいているお客様もいらっしゃいます。

Q19. どのような自治体が導入していますか?
A19

北海道議会、東京都議会などの大きな自治体から、市議会、町村議会など自治体の規模にかかわらずご利用いただいております。
詳しくは導入事例 をご覧ください。

Q20. 費用対効果はどのくらいですか?
A20

従来の書き起こし作業に比べ、半分程度の時間で議事録を作成することが可能になります。

Q21. コントロールサーバーってなんですか?
A21

リアルタイムで、同時に複数人で編集するためのソフトウェアです。

Q22. コントロールサーバーは新しいサーバーを建てる必要があるのでしょうか?
A22

必要ありません。スペックを満たしていればノートPCでも問題なく利用できます。

Q23. リアルタイムで編集をしたいのですが
A23

コントロールサーバーをオプションで導入することで可能になります。

Q24. バッチ認識にかかる時間はどのくらいですか?
A24

基本的には音声ファイルと同等の時間がかかります。認識速度を早くすることは可能ですが、その分認識精度は悪くなってしまいます。

Q25. ASPの認識にかかる時間はどのくらいですか?
A25

基本的には音声ファイルと同等の時間がかかりますが、サーバー混雑時等は時間がかかってしまうこともあります。

Q26. 音響設備の提案もしていただけるのでしょうか?
A26

はい。可能です。音声認識を最適な形で行っていただくため、音響設備周りを1から提案させていただくことも多くあります。

Q27. スマホ、タブレット等で使用することは可能ですか?
A27

現状では不可能です。申し訳ありません。

Q28. 編集ソフトのインストールは無制限なのですか?
A28

編集ソフトのインストールは無制限です。但し、USBキーを用いて起動の制御をかけます。1ライセンスにつき、1本のUSBキーとなりますので1ライセンスで同時に起動できる台数は1台となります。複数台同時に起動される場合は複数ライセンスが必要になります。
お客様の都合でUSBキーが利用できない場合でも、ライセンスファイルで対応することができます。

Q29. テキストマイニングはできますか?
A29

はい。お客様のご要望に合わせてご提案させていただきます。

Q30. これで字幕を作成したいのですが
A30

タイムスタンプが生成されるため、作成することが可能です。
J-TACというシステムでは字幕作成に特化しております。
J-TACはこちら

Q31. 情報保障での利用を考えていますが事例はありますか?
A31

講義内容の情報保障で導入していただいた事例があります。

言語モデル(音声認識辞書)について
Q32. 言語モデル(音声認識辞書)カスタマイズのためには、過去の議事録を提供しなければならないのでしょうか?
A32

音声認識エンジン「AmiVoice 」の特徴として、過去の文章を分析しながら単語の前後関係や出現確率値等を細かく分析しながら、お客様の運用に合わせた認識精度を計上することができるため、実際の議事録や録音音声をお預かりして学習をさせることが最も効果的な方法となります。
尚、保守契約では、言語モデル(音声認識辞書)のバージョンアップを年2回実施しております。実際の音声データを学習し、チューニングを行うことで、以前誤認識していた箇所が正しく変換されたり、発言者の声の特徴や言い回し等を更に学習することで、徐々に認識精度が高まるという仕組みとなっております。
データをご提供頂く際には、必要に応じて秘密保持契約を締結させて頂きますのでご安心ください。

Q33. ユーザー側で学習することはできますか?
A33

ユーザー様にて単語登録機能をお使い頂くことにより、新しいお名前、商品名、最新の時事用語等はすぐに認識できるようになります。
しかし、単語登録だけでは言語モデル(音声認識辞書)全体の精度向上とはなりませんので、弊社側でデータをお預かりさせて頂き、細かくチューニング作業をさせて頂くことを推奨しております。

Q34. 言語モデルカスタマイズとはなんですか?
A34

お客様の中でよく話される固有名詞などを前後の文脈も併せてカスタマイズすることです。カスタマイズには過去の議事録や音声データ等が必要です。

Q35. 作成した議事録を学習させることは可能ですか?
A35

お客様に作成していただいた議事録は年に2回保守として音声認識エンジンの学習に使用させていただきます。

Q36. 専門用語がたくさんあるのですが大丈夫ですか?
A36

事前に、お客様から単語リストや、過去の議事録をいただきカスタマイズする為、特有の固有名詞なども認識が可能になります。

 

Q37. 複数の辞書を作りたいのですが費用はその分かかりますか?
A37

かかりません。言語モデルカスタマイズの際にいくつかの辞書をご希望の方はご連絡ください。

VoXTについて
Q38. 議事録作成の委託はできますか?
A38

はい。VoXTサービスの一環として行っています。
VoXTはこちら

Q39. VoXTアプリがインストールできません
A39

インストールの手順については、こちら をご覧ください。

契約について
Q40. 保守の内容を教えてください
A40

年2回の音声認識エンジンチューニング以外にも、電話サポート、操作説明会の実施、バグ対応などを行います。

Q41. レンタル、リースはありますか?
A41

ございます。詳細はお問い合わせください。

Q42. 保守の加入は必須ですか?
A42

基本的には必須とさせていただいています。