本文へジャンプ

音声認識の歴史と今後

『AmiVoice』は、話者を特定せずに、
スピードの変化・抑揚・アクセントの違いに対応した、
第三世代の音声認識技術です。

第一世代(1960〜)単語認識

 単語の音声認識が可能になった段階。単語認識は音声認識の中心技術にあたるため、現在でも精度向上のための研究が行われている。

矢印

第二世代(1991〜)文章認識

 文法を統計化することで、単語の連続、つまり文章を認識することが可能になった。そのため音声をテキスト化する能力も向上。

矢印

第三世代(2001〜)人主体の認識

 不特定話者でも音声認識できるよう、事前学習の必要性を排除し、会話スピード、アクセントの違いによる問題を解決。幅広いマーケットに順応できるレベルまで到達した。

矢印

第四世代(2008〜)ユビキタス

 「いつでも」「どこでも」「だれでも」が利用できる技術へ。多様化するモバイル端末で利用可能。

矢印

第五世代(2011〜)超音声認識

 従来の音声認識の常識を覆す人間並みの認識結果の提供。オントロジーと知的推論により擬人化されたコミュニケーションインタフェースが可能に。