第一世代(1960〜)単語認識
単語の音声認識が可能になった段階。単語認識は音声認識の中心技術にあたるため、現在でも精度向上のための研究が行われている。
![]()
第二世代(1991〜)文章認識
文法を統計化することで、単語の連続、つまり文章を認識することが可能になった。そのため音声をテキスト化する能力も向上。
![]()
第三世代(2001〜)人主体の認識
不特定話者でも音声認識できるよう、事前学習の必要性を排除し、会話スピード、アクセントの違いによる問題を解決。幅広いマーケットに順応できるレベルまで到達した。
![]()
第四世代(2008〜)ユビキタス
「いつでも」「どこでも」「だれでも」が利用できる技術へ。多様化するモバイル端末で利用可能。
![]()
第五世代(2011〜)超音声認識
従来の音声認識の常識を覆す人間並みの認識結果の提供。オントロジーと知的推論により擬人化されたコミュニケーションインタフェースが可能に。