ニコニコ動画やYouTubeの音声をテキスト化する「PodCastle」 15
ストーリー by headless
認識 部門より
認識 部門より
あるAnonymous Coward 曰く、
産総研は、インターネット上の動画音声データを対象とした音声全文検索・書き起こしサービス「PodCastle」を一般公開し、音声情報検索技術の実証実験を開始した(プレスリリース)。
音声認識技術によって動画音声データをテキスト化し、誤りをユーザーに訂正してもらうことで認識結果だけでなく認識精度も向上していくというもの。産総研では2008年から日本語のポッドキャストを対象とした音声全文検索サービスを公開し、ユーザーの協力により認識精度が向上することを実証していた。今回はポッドキャストに加えてニコニコ動画、YouTube、Ustreamに対応し、日本語と英語の音声認識および検索が可能となっている。
実際の認識例を見ると、報道系などについては比較的精度良くテキスト化できているが、トーク番組などのバラエティ系はあまり精度が高くないように見受けられる。ユーザーの訂正により、認識精度はどれぐらい向上するのだろうか。
同じの。 (スコア:2)
同じ内容の開発をカタログって会社がやってたんだけど、さっきサイトを見ようとしたら、サイト [catalog.to]が無くなってたでござるの巻。
安易なAC発言反対運動中
Re:同じの。 (スコア:3, 参考になる)
サイトが無くなってたでござるの巻。
そりゃ、倒産したから [twitter.com]でしょw
#あえてそれ以上は語らない
Re: (スコア:0)
VIPで死ね
Re: (スコア:0)
お巡りさんコッチです。
ユーザをなめるな (スコア:2)
日本語の音声情報検索技術は使い物にならないとわかりました。ありがとうございました。
Re: (スコア:0)
×日本語の音声情報検索技術は使い物にならないとわかりました。ありがとうございました。
○日本語に限らず会話音声認識技術が難しいことは昔から知っていました。がんばってください。
Re: (スコア:0)
下手に昔のことを知ってるからそんなふうに思い込まされて予算巻き上げられてんじゃないの?
Re: (スコア:0)
研究のセンスの問題だろうね
この種の手法はやれば何かの結果は出てくるだろうが、音声認識の基本原理の進歩に寄与するようなものじゃない
どちらかといえば、メーカーの製品開発レベルの段階でやるような仕事でしょう
あえて産総研でやるのなら製品化まで持っていかないと
vimeoに対応するといいなー (スコア:1)
見たけど (スコア:0)
まったく言葉の形態をなしてなかった
Re: (スコア:0)
ゆっくり [atwiki.jp]に実況スレ読み上げさせればよくね?
#今年の甲子園のジャイアンコールに吹いてたのでAC