日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 20
ストーリー by hylom
失言もばっちり検索 部門より
失言もばっちり検索 部門より
schiavona 曰く、
日立製作所は、任意のキーワードを含む音声を高速に検索する技術を開発、発表した(PC Onlineの記事、ニュースリリース)。リリース文などを見ると、録音データを単純に記号化し、それをベースとして、キーワード検索を行うもののようだ。プレコンパイルしたデータをN-gramでインデックスといったところだろうか(汎用的な音素抽出アルゴリズムが肝になりそうだが、そのアピールはとくない)。
とくに目新しい感じはしないのだが、動画の検索がタグキーワードたよりになっている現状からすると、ちゃんと動くものが出てきて、音声を数値化しておく一般的な方法があるといろいろと利用場面はありそうだ。まずは、検閲需要からあたり?
通訳 (スコア:4, 興味深い)
Re:通訳 (スコア:1, 興味深い)
Re: (スコア:0)
Re:通訳 (スコア:2, 興味深い)
当時の技術からすれば、現実的にはすべての会話を蓄積しておいて、さらにその膨大なデータから検索するのは無理って判断だったと思うけど、Google などがあれだけ高速に検索できることを考えれば、もしかしたら実現可能に近づいてきてるのかもしれませんね。
少なくとも 検索 + 構文解析 のハイブリッドサービスはでてきそうな感じ。(ってか、今の Excite 翻訳とかも、イディオムはそんな感じで入っているのかな?)
それに音声解析+音声検索の技術があれば、自動翻訳を通り越して自動通訳まで幅が広がりそうな気もするので、あながち全く関係ないというわけではないと思いますよ。
ガキどもの危機 (スコア:3, おもしろおかしい)
「何時何分何秒に言ったんだよ!」という定番のセリフが根絶される日も近いということですね.
ガキども向けじゃない (スコア:3, 参考になる)
これらのところではマルチトラックの録音装置使って一切合切の会話記録を残していますが,
何か問題が生じた時にキーワードで簡単に高速検索,頭出しが出来るのはありがたいことです.
Re: (スコア:0)
Re:ガキどもの危機 (スコア:1)
「何時何分何秒地球が何回まわったときに言いましたかぁ?」
という回答不能のオプションを付けることでこの問題は解決します。
Re: (スコア:0)
カウント開始時間も気になるが、まず自転か公転か(それ以外も?)決めて欲しいな。
Re: (スコア:0)
もしわからないならば、それは君に必要のない情報だろう。
みたいなの?
「声で探す」検索システム (スコア:1, 興味深い)
マルチメディアを「声で探す」検索システムをインターネット上で実証公開
http://www.aist.go.jp/aist_j/press_release/pr2008/pr20081008/pr20081008.html [aist.go.jp]
使用目的? (スコア:0)
Re:使用目的? (スコア:1)
よーし、パパ (スコア:0)
3秒? (スコア:0)
>新技術では、音声データの実時間分の前処理が必要だが、
それは検索時間は2000時間と3秒と言わないか?
Re: (スコア:0)
Re: (スコア:0)
ネット上のデータのように毎日膨大な量のデータが増えていく状況では使い物にならないなぁ。
前処理がデータの増加に追いつかない。
辞書は大きいけど、固定されたままで変化しないという環境での検索用ね。
要は検索処理を検索キーワードに依存しない前処理部分と、依存する後処理に分割する方法を採用したので、
後処理だけ見ると速くなったように見えるという話だね。
Re: (スコア:0)
つか、一度データ化された音声のインデックス化作業が元々の音声データの実時間がデータの過多以外関係する訳は無い。
普通のエンコードだって普通にやれば実音声データと同じ時間ピッタリで終わらせる方が難しいのと一緒だろ。
Re: (スコア:0)
#3ヘッドなカセットデッキを思い出すのでAC
まずは (スコア:0)