よくある質問

アドバンスト・メディアに寄せられるよくあるご質問をまとめました。
各製品についてのご質問は下記入り口からご確認ください。

議事録・書き起こしについてのご質問

クリックで解答が表示されます。
総合
Q1. どのようなお客様が導入していますか?
A1

自治体では、地方から都市部まで規模にかかわらずご利用いただいています。
民間企業・団体では、金融機関や農業協同組合など、業種・業界にかかわらずご導入いただいています。
その他、報道機関や中央省庁にも採用実績がございます。
導入事例の詳細はこちらをご覧ください。

Q2. 議事録・書き起こし向けの各製品の違いは何ですか?
A2

各製品の違いは下記の通りです。

  AmiVoice ScribeAssist ProVoXT(プロボクスト) CyberScribe AmiVoice MinutesWriter
音声認識処理タイプ オンプレミス クラウド
(ダウンロードして編集)
クラウド
(Web上で編集)
オンプレミス
リアルタイム認識 ×
バッチ(音声ファイル)
認識
×
単語登録学習
ご提供プラン 月額定額契約 月額従量契約、月額定額契約 月額従量契約 買取+年間保守契約
こんな方におすすめ ・オンライン会議で利用したい
・セキュリティ重視
・手軽にメモ書きのような文字起こしをしたい
・官公庁/自治体
・全社利用等、多数の部署で利用したい
・クラウドで簡便に使いたい
・ブラウザ上で利用したい
・より安価なものを導入したい
・多言語(日英中)会議で、各言語を認識・翻訳したい
・官公庁/自治体
・セキュリティ重視
・一字一句漏らさず議事録を作成したい
・実績豊富な製品を導入したい
推奨利用シーン ・オンライン会議
・社内会議
・取締役会/経営会議/株主総会
・インタビュー/会見
・自治体各課会議(全庁利用)
・社内会議(全社利用)
・インタビュー/会見
・オンライン会議などWebを使った会議
・多言語(日英中)での会議
・取材、インタビュー
・自治体会議/住民説明会/各種委員会
・取締役会/経営会議/株主総会
・重要取材
Q3. 時間の削減効果、費用対効果はどのくらいですか?
A3

現在の議事録の作成状況によって異なります。
・発言内容を詳細に書き起こす議事録の場合、従来の半分以下の時間で議事録作成が可能になります。
(例)丸一日かかっていた作業が1~2時間で実施できるようになる

 

・要点をまとめた議事録の場合、要約の程度にもよりますが、3割程度の作業時間削減が見込めます。
(例)3時間かかっていた作業が2時間程度で実施できるようになる

Q4. 自動要約機能やテキストマイニング機能はついていますか?
A4

いずれの製品にも、自動要約機能やテキストマイニング機能は備わっていません。
但し、AmiVoice ScribeAssistの絞り込み検索機能を活用すれば、発言者・キーワード・タグなどで絞り込んでから議事録出力ができるため、要約された議事録に近しいデータを作成可能です。

Q5. トライアルは可能ですか?
A5

お問い合わせ内容をもとにご案内いたします。
お問い合わせフォームよりご相談ください。

Q6. 最低契約期間はありますか?
A6

最低12ヶ月からのご契約が可能です。
実際のご提供は弊社パートナー企業が行いますので、詳細はその際にご案内させていただきます。

Q7. 地方への対応は可能ですか?
A7

首都圏や地方に関わらず、弊社パートナー企業経由で説明対応を行っております。
適切な対応窓口をご紹介いたしますので、お問い合わせフォームよりご相談ください。

認識精度について
Q8. 音声認識率は何パーセントですか?
A8

会議の内容や発話者、録音環境により変化します。あくまで目安ですが、以下の認識率が見込めます。
・地方議会や大手企業の役員会議など、整然と発言するフォーマルな会議の場合:認識率90%以上
・軽いミーティングや打合せなどの場合:認識率50%~80%程度
※会議の内容に関わらず、口元で収音できない場合は、認識精度が大きく下がります。

Q9. 認識精度は喋るスピードに左右されますか?
A9

早口や言いよどみのある音声の場合、認識精度が下がります。
アナウンサーのように落ち着いたスピードで、明瞭に話していただくと高い認識率が見込めます。

Q10. 方言も正しく認識されますか?
A10

アクセントやイントネーションの違い、発話スピードの緩急に対応しています。
ただし単語自体が共通語と異なる場合は、音声認識エンジンに単語登録されていないことが多いため、認識精度は下がります。
(例)関西の方言である「~やけど」が「火傷」と認識される

辞書に入っていない方言については「単語登録機能」を活用することで、地域特有の言い回しや話題・固有名詞・地名なども認識が可能です。

Q11. リアルタイムで音声を処理する場合と、録音した音声を処理する場合(クラウドサービス含む)では認識精度は変わりますか?
A11

変わりません。認識精度は、録音時のマイクシステムや録音環境によって変化します。

認識処理について
Q12. 同時に複数人が発言した場合、それぞれを別の音声として認識できますか?
A12

誤認識に繋がるため、順番に発言していただくことを推奨しています。
ただし録音音声は記録されているため、音声を確認して認識結果を修正することは可能です。

 

■AmiVoice ScribeAssist
デバイスを分けて設定することで、同時に発言した場合でも認識することができます。

 

■CyberScribe
アカウントごとに話者振り分けが可能なため、参加者それぞれのアカウントから会議参加している場合は発話が被っても問題はありません。ただし、1つのアカウントの中で複数人の声が重なってしまうと誤認識となります。

Q13. 音声ファイル認識では完了までどれくらいの時間がかかりますか?
A13

■AmiVoice ScribeAssist
音声ファイルと同等の時間がかかります。

 

■ProVoXT
あくまで目安ですが、下記の通りとなります(サーバーの混雑状況により変動することがございます)。
・1時間以内の音声ファイル:実時間程度
・1時間以上の音声ファイル:実時間以内

Q14. 複数のファイルをまとめて処理依頼することは可能ですか?
A14

■AmiVoice ScribeAssist
可能です。但し、実際に認識処理を実施するのは1ファイルずつになります。

 

■ProVoXT
1回のアップロードにつき最大5ファイル、合計1GB、までまとめて依頼することが可能です。

Q15. 音声ファイルからの認識の際、拡張子の指定はありますか?
A15

■AmiVoice ScribeAssist
・音声ファイルの対応拡張子 : WAV(PCM)、WMA、MP3、M4A
・動画ファイルの対応拡張子:WMV、MP4

 

■ProVoXT
・音声ファイルの対応拡張子 : WAV(PCM)、WMA、MP3、M4A
・動画ファイルの対応拡張子 : WMV、AVI、MP4、M4V

録音環境について
Q16. 集音マイクやICレコーダーからの音声は認識可能ですか?
A16

可能です。
但し、ICレコーダーや集音マイクなどの音声は、雑音を一緒に拾ってしまったり、発声をする際の口元と距離が遠いことが多いため音声認識には不向きです。
ハンドマイクやスタンドマイク、グースネックマイク、WEB会議時にはヘッドセットマイクなど、指向性が高く、雑音を吸収しにくいマイクを設営し、口元にマイクを近づけて録音することを推奨しています。
こうしたマイクの用意が難しい場合、バウンダリーマイクなどを会議参加者に対して適切な個数ご用意いただくことをお勧めします。

Q17. 通話音声の音声認識は可能ですか?
A17

通話音声データは、通常の音声と異なる音声情報のため、コンタクトセンター向けソリューションが最適です。
詳細はこちらをご覧ください。

AmiVoice ScribeAssistについて
Q18. ネットワーク接続は必要ですか?
A18

ネットワーク接続不要のスタンドアローン型となっております。

Q19. Web会議でリアルタイム認識することは可能ですか?
A19

可能です。

Q20. 会議中にリアルタイムで認識結果を編集することは可能ですか?
A20

可能です。

Q21. 認識結果を字幕表示させることは可能ですか?
A21

ポップアップ機能を字幕としてご活用いただけます。また、Zoomと連携させることで参加者全員の画面に字幕を表示させることが可能です。

ProVoXTについて
Q22. AmiVoice Rewriterとは何ですか?
A22

ProVoXTの認識結果を効率的に編集できる、スタンドアローン型のソフトウェアです。音声と認識結果が紐づけられているため、編集したい箇所の音声をピンポイントで聞くことができます。