テレビ朝日クリエイト様
字幕制作工程の3分の1を削減!
テーマ | : | 字幕作成支援システム |
業種 | : | |
規模 | : | |
サービス | : | 字幕作成支援システム「J-TAC」 |
効果 | : |
テーマ | : | 字幕作成支援システム |
業種 | : | |
規模 | : | |
サービス | : | 字幕作成支援システム「J-TAC」 |
効果 | : |
映像や舞台制作などを幅広く手掛けるテレビ朝日クリエイト様はこのほど、テレビ番組の字幕制作に必要な3大工程のうち、1つの工程を全て取り除くことに成功しました。音声認識技術を含めた様々な方法を試していくなかでAmiVoiceと出会い、アドバンスト・メディアとの共同開発に着手。そこで生まれた字幕作成支援システム「J-TAC」は、関係者が目を見張るほどの成果と次への希望をもたらしました。
「アドバンスト・メディアさんと出会えて本当に良かったと思います!」
テレビ朝日クリエイト様の字幕制作部主任を務める横山岳史さんと下永吉寛之さんは、人手への依存度が大きい字幕制作業務の自動化を長年検証し、ついにJ-TACの開発に至った経緯を話してくれました。
テレビ番組に表示されている字幕を制作するには、専用の字幕制作機を用いて、音声をキーボードで打ち込む「字幕テキスト制作」、発話されたタイミングに合わせてテキスト(字幕)を表示させる「表示タイミング設定」「表示位置設定」の3つの工程を順に繰り返しながら字幕制作を行っています。この作業では、何度も同じ映像を見聞きする必要があります。そのため各工程に習熟した社員でも、1本の放送用字幕を完成させるまでにはかなりの集中力と実際の放送尺の何倍もの制作時間が必要でした。
横山さんと下永吉さんは、字幕制作業務の効率化に向けて主要メーカーの音声認識技術など考えられる限りの可能性に挑戦してきました。しかし、「結局、新しいことを試すと別のプロセスに人手を必要とし、頼みの音声認識技術にしてもテレビ番組には様々な音源が交錯する映像が多く、また、別の人がクリアな音で話し直して認識させる方法もありますが、それも人手がかかり従来と大差ないのです」と横山さんは過去の苦労を振り返ります。
そうした中で、AmiVoiceのデモを見る機会があったのです。アドバンスト・メディアの音声認識技術のデモを見た2人は、「これを使えば表示タイミング設定を自動化できるのではないか」と直感しました。
デモでは、発話された時間情報が、音声認識結果(テキスト)とともに数秒などの単位で刻々と表示されていきます。現在のテレビ朝日字幕仕様では、1画面の文字数は最大15.5文字×2行、表示時間2秒以上などが求められ、認識されたテキスト情報もこのタイミングに合わせてうまく表示できるようにしなければなりません。「難しい話ですが、アドバンスト・メディアのスタッフも『頑張ります』と言ってくださり、共同開発をスタートすることができました」。
専用の字幕制作機、業界用語など特殊な世界の理解から共同開発は始まり、音が出ていないときのタイミングの合わせ方、さらに、どこでも誰でも使える操作性が求められました。
「無茶も言いましたが、アドバンスト・メディアさんはいつも前向きで、我々のように音声認識では素人のアイデアにも必ず結果を出してくれました。完成したJ-TACは本当に使いやすく、アフターケアについても申し分ありません」と横山さん、下永吉さんは笑顔を見せます。
「現在はJ-TAC方式を基礎としたリアルタイム字幕半自動送出ソフトの開発を行っており、それによって、さらなる業務効率化を達成したいと考えています」。それには雑音や複数人の声の重なりなど様々な障害を克服する必要がありますが、「J-TACでできることは他にもあり、目の前の課題をきっちり潰していくことで最終的に直接認識の世界にもつながってくるはず」と、さらなる進化に意欲を燃やします。
「J-TAC」のチューニングには難しい部分もありましたが、今回の成果はテレビ業界をはじめ動画制作に関わるさまざまな法人・個人にも大きく貢献できるものだと考えています。「J-TAC」の採用によって作業時間が大幅に削減できることも有益ですが、それよりも表示タイミング設定に時間を費やしていた人材が、他の付加価値の高い業務にシフトできる意味の方が大きいと考えています。社員が新しい仕事に挑戦できる環境は、本人にとっても会社にとっても大きな利益です。今後の目標は音声の直接認識です。「J-TAC」が実現したように、あきらめず信念を持って次の進化に向かっていきたいと思います。
近年、医療機関の待合室や飲食店の一角など、さまざまな場所でテレビの字幕放送を目にする機会が増えてきました。もちろん以前より、字幕は耳の遠い高齢者や聴覚障害者にとっては欠かせない機能として国も普及を促進しています。字幕放送は今後、情報のバリアフリー化と視聴機会の多様化が進むなかで、テレビにとどまらず、Webサービスでも大切な要素となってくることは間違いありません。
平成23年度における字幕放送等の実績の概要 総務省HPより
http://www.soumu.go.jp/menu_news/s-news/01ryutsu09_02000045.html
「視聴覚障害者向け放送普及行政の指針」の普及目標の対象となる放送番組における字幕番組の割合(注1) | 総放送時間に占める字幕放送時間の割合 | |
NHK(総合) | 70.6% [+8.4%] | 61.0% [+4.8%] |
NHK(教育) | 53.5% [+1.0%] | 45.5% [+2.9%] |
在京キー5局(注2) | 90.8% [+1.9%] | 46.1% [+2.2%] |
在阪準キー4局(注3) | 90.9% [+5.3%] | 41.7% [+0.3%] |
在名広域4局(注4) | 84.1% [+6.7%] | 41.3% [+2.8%] |
全国の系列ローカル局(在阪準キー4局及び在名広域4局を除く101社) | 64.0% [+2.8%] | 32.9% [+1.5%] |
※[ ]は対前年度比
(注1)週間のサンプル週(平成23年5月30日(月)~6月5日(日)及び11月28日(月)~12月4日(日))における調査。普及目標の対象となる放送番組とは、7時から24時までの間に放送される番組のうち、次に掲げる放送番組を除くすべての放送番組をいう。
(注2)在京キー5局:日本テレビ放送網(株)、(株)TBSテレビ、(株)テレビ朝日、(株)フジテレビジョン、(株)テレビ東京
(注3)在阪準キー4局:(株)毎日放送、朝日放送(株)、讀賣テレビ放送(株)、関西テレビ放送(株)
(注4)在名広域4局:中部日本放送(株)、東海テレビ放送(株)、名古屋テレビ放送(株)、中京テレビ放送(株)