日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開

日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 20

ストーリー by hylom 2008年10月08日 15時29分
失言もばっちり検索部門より

日立製作所は、任意のキーワードを含む音声を高速に検索する技術を開発、発表した（PC Onlineの記事、ニュースリリース）。リリース文などを見ると、録音データを単純に記号化し、それをベースとして、キーワード検索を行うもののようだ。プレコンパイルしたデータをN-gramでインデックスといったところだろうか（汎用的な音素抽出アルゴリズムが肝になりそうだが、そのアピールはとくない）。

とくに目新しい感じはしないのだが、動画の検索がタグキーワードたよりになっている現状からすると、ちゃんと動くものが出てきて、音声を数値化しておく一般的な方法があるといろいろと利用場面はありそうだ。まずは、検閲需要からあたり？

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索20コメント Log In/Create an Account

通訳 (スコア:4, 興味深い)

by unnamed7 (33206) on 2008年10月08日 16時03分 (#1434234) 日記

多言語対応したら通訳する機械作れんじゃない？
- Re:通訳 (スコア:1, 興味深い)
  
  by Anonymous Coward on 2008年10月08日 16時26分 (#1434247)
  
  通訳（翻訳）するには全く別の技術（自然言語処理）が必要ですよそのためのインターフェース的な物にはなりえるでしょうから、通訳機器のきっかけにはなるでしょうね。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    多分あまり関係ないと思う。そういう分野では、検索必要ないでしょ。
    - Re:通訳 (スコア:2, 興味深い)
      
      by harako (114) on 2008年10月08日 19時11分 (#1434391)
      
      昔、DOS/V magazine かなにかの記事で翻訳ソフト特集があって、その中でソフトの開発担当が「一番精度が高いのは対訳のマッチングです」とかなんとか言ってたのを思い出します。
      
      当時の技術からすれば、現実的にはすべての会話を蓄積しておいて、さらにその膨大なデータから検索するのは無理って判断だったと思うけど、Google などがあれだけ高速に検索できることを考えれば、もしかしたら実現可能に近づいてきてるのかもしれませんね。
      
      少なくとも検索 + 構文解析のハイブリッドサービスはでてきそうな感じ。(ってか、今の Excite 翻訳とかも、イディオムはそんな感じで入っているのかな?)
      
      それに音声解析+音声検索の技術があれば、自動翻訳を通り越して自動通訳まで幅が広がりそうな気もするので、あながち全く関係ないというわけではないと思いますよ。
      
      シェア
      
      親コメント
ガキどもの危機 (スコア:3, おもしろおかしい)

by SteppingWind (2654) on 2008年10月08日 18時01分 (#1434336)

「何時何分何秒に言ったんだよ!」という定番のセリフが根絶される日も近いということですね.
- ガキども向けじゃない (スコア:3, 参考になる)
  
  by Anonymous Coward on 2008年10月08日 18時12分 (#1434343)
  
  コールセンターや銀行・証券，消防，警察等の電話受付業務には福音となる技術ですよ．
  これらのところではマルチトラックの録音装置使って一切合切の会話記録を残していますが，
  何か問題が生じた時にキーワードで簡単に高速検索，頭出しが出来るのはありがたいことです．
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ジャスラック歓喜のあまり失禁
- Re:ガキどもの危機 (スコア:1)
  
  by genkikko (36404) on 2008年10月09日 9時00分 (#1434661) ホームページ日記
  
  ＞「何時何分何秒に言ったんだよ!」
  
  「何時何分何秒地球が何回まわったときに言いましたかぁ？」
  という回答不能のオプションを付けることでこの問題は解決します。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    >地球が何回まわったとき
    カウント開始時間も気になるが、まず自転か公転か(それ以外も？)決めて欲しいな。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    今が何回目かを教えてくれれば、それを元に答えよう。
    もしわからないならば、それは君に必要のない情報だろう。
    
    みたいなの?
「声で探す」検索システム (スコア:1, 興味深い)

by Anonymous Coward on 2008年10月08日 19時54分 (#1434409)

産業技術総合研究所から

マルチメディアを「声で探す」検索システムをインターネット上で実証公開
http://www.aist.go.jp/aist_j/press_release/pr2008/pr20081008/pr20081008.html [aist.go.jp]
使用目的？ (スコア:0)

by Anonymous Coward on 2008年10月08日 16時04分 (#1434235)

http://srad.jp/yro/article.pl?sid=08/10/04/003229 [srad.jp]ここにつながるのか
- Re:使用目的？ (スコア:1)
  
  by 127.0.0.1 (33105) on 2008年10月08日 17時13分 (#1434281) 日記
  
  ニコ動で自動字幕を実現とかみたいな感じで使うのかと思った、のは嘘ですすいません。
  
  シェア
  
  親コメント
よーし、パパ (スコア:0)

by Anonymous Coward on 2008年10月08日 20時38分 (#1434438)

2000時間の中から４分３３秒を演奏している部分を検索しちゃうぞ
3秒？ (スコア:0)

by Anonymous Coward on 2008年10月08日 21時38分 (#1434474)

日経BP記事 [nikkeibp.co.jp]より

>新技術では、音声データの実時間分の前処理が必要だが、

それは検索時間は2000時間と3秒と言わないか？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  n要素のハッシュテーブルの構築にはO(n)以上かかりますけど、検索はO(1)って言いませんか？
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    実時間の前処理が必要ということになると、
    ネット上のデータのように毎日膨大な量のデータが増えていく状況では使い物にならないなぁ。
    前処理がデータの増加に追いつかない。
    
    辞書は大きいけど、固定されたままで変化しないという環境での検索用ね。
    
    要は検索処理を検索キーワードに依存しない前処理部分と、依存する後処理に分割する方法を採用したので、
    後処理だけ見ると速くなったように見えるという話だね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      実時間の前処理が必要ということになると、ネット上のデータのように毎日膨大な量のデータが増えていく状況では使い物にならないなぁ。
      
      いや、別にインデックス化に実時間と同じ時間がかかるって意味では無くて、検索対象のデータを全てインデックス化が必要だと言う意味と思うぞ。
      つか、一度データ化された音声のインデックス化作業が元々の音声データの実時間がデータの過多以外関係する訳は無い。
      普通のエンコードだって普通にやれば実音声データと同じ時間ピッタリで終わらせる方が難しいのと一緒だろ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  インデクシングは録音と並行してできないのかなあ……。
  
  #3ヘッドなカセットデッキを思い出すのでAC
まずは (スコア:0)

by Anonymous Coward on 2008年10月09日 9時35分 (#1434676)

社員の業務中の会話を検閲します #関連会社なんでAC

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 20

日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 More ログイン

通訳 (スコア:4, 興味深い)

Re:通訳 (スコア:1, 興味深い)

Re: (スコア:0)

Re:通訳 (スコア:2, 興味深い)

ガキどもの危機 (スコア:3, おもしろおかしい)

ガキども向けじゃない (スコア:3, 参考になる)

Re: (スコア:0)

Re:ガキどもの危機 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

「声で探す」検索システム (スコア:1, 興味深い)

使用目的？ (スコア:0)

Re:使用目的？ (スコア:1)

よーし、パパ (スコア:0)

3秒？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

まずは (スコア:0)

スラド