よくある質問

アドバンスト・メディアに寄せられるよくあるご質問をまとめました。
各製品についてのご質問は下記入り口からご確認ください。

議事録・書き起こしについてのご質問

クリックで解答が表示されます。
利用シーン、使い方、マイクについて
Q1. 集音マイクやICレコーダーからの音声は認識可能ですか?
A1

ICレコーダーや集音マイクなどでの音声は、あらゆる雑音も一緒に拾ってしまったり、発声をする際の口元と距離が遠いことが多いため、音声認識には不向きです。ハンドマイクや、スタンドマイクなど、あまり雑音を吸収しないマイクを設営し、口元の近くにマイクを近づけて運用するような環境が必要です。文字変換精度比較はこちらをご覧ください

Q2. 音声認識精度は何パーセントですか?
A2

会議の内容や発話者、録音環境により変化します。
原稿を読む等、整然と発言される傾向が強い地方議会や、大手企業の役員会議などフォーマルな会議の場合は、90%以上の認識率が出るケースも多い一方、軽微なミーティングや打合せ等になると認識率は50%~80%程度が多いと思われます。
いずれにしても、スタンドマイクやハンドマイク等、口元で音を拾えない場合は、認識精度が大きく下がるケースが多いです。文字変換精度比較はこちらをご覧ください

Q3. 要約の議事録を作成したいのですが、そのようなシーンには向いていますか? 自動要約機能はついていますか?
A3

要約機能はないため、簡易な議事録にはあまり向いていません。
一言一句を音声認識で文字化するため、詳細に議事録を作成する会議に向いています。
要約する場合は、編集ソフトを用いて音声と認識結果を確認し、手動で作業する必要があります。

Q4. 早口でも認識できますか? 方言は認識できますか?
A4

アナウンサーのような明瞭な喋り方であれば、高い認識精度が出ます。早口だったり、少しつっかえて喋ってしまった音声だと、精度は低くなりますが、音声認識を行うことは可能です。

 

イントネーションやアクセントの違いに関しては問題なく認識ができますが、単語自体が異なる方言の場合は、登録されていない事が多いため、精度が下がります。
地域特有の話題・固有名詞・地名等は過去の議事録をお預かりして認識ができるように事前にカスタマイズすることが可能です(音声認識エンジンモードカスタマイズ)。

 

トップレベルの会議、議会での利用を中心に、北は北海道から南は鹿児島まで全国の自治体様、民間企業様でご利用頂いております。

Q5. 時間の削減効果、費用対効果はどのくらいですか?
A5

議事録の作成状況によって異なります。
発言内容を詳細に書き起こす議事録であれば、従来の半分程度の時間で議事録を作成することが可能になります。(丸一日の作業が、半日になる等)

 

要約議事録の場合は、要約のレベルにもよりますが、人間が手を大きくくわえることになるので、2~3割程度の時間削減になるかと思います。(3時間弱の作成時間が、2時間程度になる等)

Q6. マイクは指定のものでなければならないのですか?
A6

特に指定はありません。
もともとハンドマイクやスタンドマイクにて運用されていれば、良好な音声が取れるケースが多いです。

Q7. 推奨のマイクシステムはどのようなものでしょうか?
A7

1人につき1本有線スタンドマイクを設置する形が、精度が高く実績が多いマイクシステムです。口元への指向性があり、狙って声を収録できます。かつボタンを押して使うことで、ノイズが入らないように運用ができます。(目安として、有線スタンドマイク10本の構成の場合、価格感はおよそ150万円~となります)

Q8. 同時に発言した場合は認識できますか?
A8

複数のマイクをミキサーにて1つの音声に集約をする為、同時に発言した場合は、音同士が被って収録されてしまい、誤認識の原因となります。そのため、自由活発な会議の場合は、マイクがあったとしても、誤認識が増える傾向にあります。
相手が話し終わるまで待っていただいたり、順番に発言するような、フォーマルな会議形態にシフトしていただくことを推奨しております。

Q9. トライアルは可能でしょうか?
A9

有償となりますが、よりご状況に合う形でのトライアルをご提案させて頂きます。お客様のご要望等、内容を確認し検討いたしますので、まずはお問い合わせをお願いします。

ソフトウェアについて
Q10. 「音声認識エンジンモードカスタマイズ」とはなんですか? 専門用語を覚え込ませることは可能ですか?
A10

よく使用される固有名詞などを、前後の文脈も併せてカスタマイズすることです。
カスタマイズには2~3か月期間を要しますが、その間は汎用の辞書を用いて利用開始することができます。
カスタマイズには過去の議事録や音声データ等が必要です。

Q11. 「音声認識エンジンモードカスタマイズ」には、過去の議事録を提供が必要でしょうか。 導入後のメンテナンスはありますか?
A11

はい。
音声認識エンジン「AmiVoice」は、過去の文章を分析し、単語間の前後関係や、出現確率値等を細かく分析しながら、お客様ごとの現場に合わせてより認識精度が高められます。そのためには、カスタマイズを希望される場合は、実際の議事録をワードやテキストでご提供頂いております。

 

尚、保守契約では、音声認識辞書のバージョンアップを年1回実施しています。近々に作られた議事録を追加学習することで、より現状に即した文脈に沿った言語モデルが構築されたり、それまで登録されていなかった新出の単語の登録、および単語の出現確率の再設定をすることができますので、以前誤認識していた箇所が正しく変換されるなど、徐々に認識精度が高まるという仕組みとなっています。同じ辞書を使い続けていく場合、音声認識辞書は自動には更新されないため、年数が経つ毎に精度が低下していきます。
なお、データをご提供頂く際(ご契約後)には、必要に応じて秘密保持契約を締結いたしますので、ご相談ください。

Q12. ライセンスの最小規模はどうなりますでしょうか? マイクの本数分のライセンスが必要となるのでしょうか?
A12

最小構成は
・ 録音認識ソフト「AmiVoice Recorder」1ライセンス
・ 編集ソフト「AmiVoice Rewriter」1ライセンス
・音声認識エンジンモードライセンス(音声認識用辞書)1ライセンス
です。
マイクの本数とライセンスは関係なく、各アプリケーションの利用方法(規模)によります。

Q13. 会議が2部屋で同時開催される場合、「AmiVoice Recorder」は2ライセンス必要ですか?
A13

リアルタイムである必要がなければ、1つの会議は「AmiVoice Recorder」を用いてリアルタイムに音声認識処理を行い、もう1つの会議は会議終了後に録音した音声ファイル(wma,wav,mp3等)にて「AmiVoice Recorder」で音声認識処理を行う運用であれば、「AmiVoice Recorder」は1ライセンスで利用できます。
2部屋の会議をそれぞれリアルタイムに音声認識処理を行う場合は「AmiVoice Recorder」が2ライセンス必要となります。

Q14. ユーザー側で音声認識学習することはできますか?
A14

ユーザー様にて単語登録機能をお使い頂くことにより、新しいお名前、商品名、最新の時事用語等はすぐに認識できるようになります。
しかし、単語登録だけでは言語モデル(音声認識辞書)全体の精度向上とはなりませんので、弊社側でデータをお預かりさせて頂き、細かくバージョンアップ作業をさせて頂くこと(音声認識エンジンモードカスタマイズ)を推奨しております。

Q15. 「AmiVoice Recorder」「AmiVoice Rewriter」のインストールは無制限ですか?
A15

「AmiVoice Recorder」は1ライセンスにつき1端末のみのインストールとなります。
「AmiVoice Rewriter」は無制限にインストール可能ですが、専用の制御USBキーを用いて、同時起動可能台数をライセンス数量と同じ数に限定しております。「AmiVoice Rewriter」のライセンス数と同じ数だけ、USBキーを提供します。

Q16. ProVoXT(クラウドサービス)とはどのように違うのですか?
A16

ProVoXTは録音ファイルの認識のみです。AmiVoice議事録作成支援システムはリアルタイム認識に対応しており、スタンドアローンでの利用が可能で、ネットワーク不要でお使いいただけます。
音声認識エンジンは、どちらもお客様ごとにカスタマイズが可能です。

Q17. リアルタイムで音声を処理する場合と、録音した音声を処理する場合(クラウドサービス含む)では認識精度は変わりますか?
A17

変わりません。
AmiVoice議事録作成支援システムでは、それぞれのプランに適した音声認識辞書を提供しているため、サービス形態によっても変化はありません。
お客様専用に辞書を構築する「音声認識エンジンモードカスタマイズ」を行う事により、運用形態問わず認識精度を上げることが可能です。

Q18. 作成した議事録を学習させることは可能ですか?
A18

可能です。
買取型の保守プランの一環として、お客様に作成していただいた議事録を年1回音声認識エンジンチューニング学習に使用させていただきます。

Q19. インタビュー、セミナー等でも使用したいのですが可能ですか?
A19

口元がマイクに近い環境で録音された音声であれば問題ありません。実際にインタビューやセミナー用途でお使いいただいているお客様もいらっしゃいます。

Q20. 認識結果データを、会議中にリアルタイムで編集をしたいのですが、可能でしょうか?
A20

音声認識データ管理ソフトウェア「AmiVoice ControlServer」をオプションで導入することで可能になります。

Q21. スタンドアロ―ン版にて、音声ファイルからの認識にかかる時間はどのくらいですか?
A21

基本的には音声ファイルと同等の時間がかかります。スペックによっては1~3割早く処理できる場合もございます。

Q22. ProVoXT(クラウドサービス)にて、音声ファイルからの認識にかかる時間はどのくらいですか?
A22

音声分散処理の技術を用いており、基本的には音声ファイルの時間以内で処理が可能です。

Q23. 音声ファイルからの認識は、拡張子などの指定はありますか? ファイルをまとめて処理依頼することは可能ですか?
A23

・音声ファイルの対応拡張子 : WAV(PCM)、WMA、MP3、M4A
・動画ファイルの対応拡張子 : WMV、AVI、MP4、M4V
いずれのサービスでも、録音された音声ファイルをまとめて認識にかけることも可能です。

Q24. 英語の認識は出来ますか?
A24

開発中ですが、英語の音声認識エンジンも保有しております。
日本語音声認識辞書をご導入済みのユーザー様からのご依頼であれば、内容確認後、相談とさせて頂きます。

Q25. 通話音声の音声認識は可能ですか?
A25

通話音声の書き起こしの場合はより特化したコールセンターソリューションがマッチしますので、こちらをご覧下さい。

Q26. AmiVoice議事録作成支援システムの対応OSは何ですか?また、推奨スペックは?
A26

「AmiVoice Recorder」の推奨スペックは下記となります。
OS:Windows® 10 Pro、Windows® 8.1 Pro、Windows® 7 Professional(Service Pack 1以降) 各日本語 OS、64ビット版 (x64)を推奨しております。
CPU:インテル ® Core™ i5プロセッサー (2.5GHz)以上
メモリ:4GB以上

 

「AmiVoice Rewriter」は上記を満たさなくても使うことが可能です。

契約内容について
Q27. スタンドアローン版とProVoXT(クラウドサービス)との違いは何ですか?
A27

スタンドアローン版ではネットワークを介さずに、PCのみで利用が可能です。ProVoXT(クラウドサービス)は弊社サーバーに音声ファイルをアップロードするため、ネットワーク環境が必須です。
お客様のサーバー環境にクラウド環境を構築する受託案件構成もご提案可能です。お問い合わせください。

Q28. 購入をした場合、保守の加入は必須ですか?
A28

必須です。

その他
Q29. 「AmiVoice ControlServer」は新しいサーバーを立てる必要があるのでしょうか?
A29

必要ありません。管理用のサーバーソフトでのため、スペックを満たしていればノートPCでも問題なく利用できます。

Q30. どのようなお客様(自治体、企業、メディア等)が導入していますか?
A30

自治体では、北海道議会、東京都議会などの大きな自治体から、市議会、町村議会など数千人規模の自治体まで、規模にかかわらずご利用いただいております。

 

企業等では、金融機関や大手企業、農協での導入が多く、発言内容をしっかり残すことが多い経営会議や取締役会など、重要会議の議事録作成の用途が多いです。
ほか、日本放送協会(NHK)様等、メディアのお客様にて、取材データの書き起こしにもお使いいただいております。
導入事例はこちらをご覧ください。

Q31. スマホ、タブレット等で使用することは可能ですか?
A31

現状対応しておりません。

Q32. 音声認識結果をテキストマイニングしたいのですが、こちらのシステムで可能ですか?
A32

本システムでは機能として持ち合わせておりません。別会社様が提供されているマイニングソフトウェアに、弊社システムから出力をしたCSV等のデータを取り込んで処理されることは可能です。

Q33. 字幕を作成したいのですが可能でしょうか?
A33

タイムスタンプとともに、CSVで出力することが可能です。認識精度が良ければ、使うことも可能かと思います。
メディア関連の方などへは、別途適切なソリューションをご紹介しますので、お問い合わせフォームよりご相談ください。

Q34. 聴覚に障害のある方への情報保障を目的としての利用は可能でしょうか?
A34

認識した結果を同時に編集して、投影することができますので可能ですが、より適したソリューション聴覚障害者向けのアプリケーションを推奨しています。詳しくはこちらをご参照ください。

Q35. 地方への対応は可能でしょうか?
A35

関東首都圏や地方に関わらず、弊社代理店様経由で説明対応を行っております。適切な対応窓口をご紹介させていただきますので、お問い合わせフォームよりご相談ください。