パスワードを忘れた? アカウント作成
37067 story
ソフトウェア

日立製作所、2000時間の録音から3秒で音声を検索できる技術を公開 20

ストーリー by hylom
失言もばっちり検索 部門より

schiavona 曰く、

日立製作所は、任意のキーワードを含む音声を高速に検索する技術を開発、発表した(PC Onlineの記事ニュースリリース)。リリース文などを見ると、録音データを単純に記号化し、それをベースとして、キーワード検索を行うもののようだ。プレコンパイルしたデータをN-gramでインデックスといったところだろうか(汎用的な音素抽出アルゴリズムが肝になりそうだが、そのアピールはとくない)。

とくに目新しい感じはしないのだが、動画の検索がタグキーワードたよりになっている現状からすると、ちゃんと動くものが出てきて、音声を数値化しておく一般的な方法があるといろいろと利用場面はありそうだ。まずは、検閲需要からあたり?

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 通訳 (スコア:4, 興味深い)

    by unnamed7 (33206) on 2008年10月08日 16時03分 (#1434234) 日記
    多言語対応したら通訳する機械作れんじゃない?
    • Re:通訳 (スコア:1, 興味深い)

      by Anonymous Coward on 2008年10月08日 16時26分 (#1434247)
      通訳(翻訳)するには全く別の技術(自然言語処理)が必要ですよ そのためのインターフェース的な物にはなりえるでしょうから、通訳機器のきっかけにはなるでしょうね。
      親コメント
      • by Anonymous Coward
        多分あまり関係ないと思う。そういう分野では、検索必要ないでしょ。
        • Re:通訳 (スコア:2, 興味深い)

          by harako (114) on 2008年10月08日 19時11分 (#1434391)
          昔、DOS/V magazine かなにかの記事で翻訳ソフト特集があって、その中でソフトの開発担当が「一番精度が高いのは対訳のマッチングです」とかなんとか言ってたのを思い出します。

          当時の技術からすれば、現実的にはすべての会話を蓄積しておいて、さらにその膨大なデータから検索するのは無理って判断だったと思うけど、Google などがあれだけ高速に検索できることを考えれば、もしかしたら実現可能に近づいてきてるのかもしれませんね。

          少なくとも 検索 + 構文解析 のハイブリッドサービスはでてきそうな感じ。(ってか、今の Excite 翻訳とかも、イディオムはそんな感じで入っているのかな?)

          それに音声解析+音声検索の技術があれば、自動翻訳を通り越して自動通訳まで幅が広がりそうな気もするので、あながち全く関係ないというわけではないと思いますよ。
          親コメント
  • ガキどもの危機 (スコア:3, おもしろおかしい)

    by SteppingWind (2654) on 2008年10月08日 18時01分 (#1434336)

    「何時何分何秒に言ったんだよ!」という定番のセリフが根絶される日も近いということですね.

    • by Anonymous Coward on 2008年10月08日 18時12分 (#1434343)
      コールセンターや銀行・証券,消防,警察等の電話受付業務には福音となる技術ですよ.
      これらのところではマルチトラックの録音装置使って一切合切の会話記録を残していますが,
      何か問題が生じた時にキーワードで簡単に高速検索,頭出しが出来るのはありがたいことです.
      親コメント
      • by Anonymous Coward
        ジャスラック歓喜のあまり失禁
    • >「何時何分何秒に言ったんだよ!」

      「何時何分何秒地球が何回まわったときに言いましたかぁ?」
      という回答不能のオプションを付けることでこの問題は解決します。
      親コメント
      • by Anonymous Coward
        >地球が何回まわったとき
        カウント開始時間も気になるが、まず自転か公転か(それ以外も?)決めて欲しいな。
      • by Anonymous Coward
        今が何回目かを教えてくれれば、それを元に答えよう。
        もしわからないならば、それは君に必要のない情報だろう。

        みたいなの?
  • by Anonymous Coward on 2008年10月08日 19時54分 (#1434409)
    産業技術総合研究所から

    マルチメディアを「声で探す」検索システムをインターネット上で実証公開
    http://www.aist.go.jp/aist_j/press_release/pr2008/pr20081008/pr20081008.html [aist.go.jp]
  • by Anonymous Coward on 2008年10月08日 16時04分 (#1434235)
    http://srad.jp/yro/article.pl?sid=08/10/04/003229 [srad.jp]ここにつながるのか
  • by Anonymous Coward on 2008年10月08日 20時38分 (#1434438)
    2000時間の中から4分33秒を演奏している部分を検索しちゃうぞ
  • by Anonymous Coward on 2008年10月08日 21時38分 (#1434474)
    日経BP記事 [nikkeibp.co.jp]より

    >新技術では、音声データの実時間分の前処理が必要だが、

    それは検索時間は2000時間と3秒と言わないか?
    • by Anonymous Coward
      n要素のハッシュテーブルの構築にはO(n)以上かかりますけど、検索はO(1)って言いませんか?
      • by Anonymous Coward
        実時間の前処理が必要ということになると、
        ネット上のデータのように毎日膨大な量のデータが増えていく状況では使い物にならないなぁ。
        前処理がデータの増加に追いつかない。

        辞書は大きいけど、固定されたままで変化しないという環境での検索用ね。

        要は検索処理を検索キーワードに依存しない前処理部分と、依存する後処理に分割する方法を採用したので、
        後処理だけ見ると速くなったように見えるという話だね。
        • by Anonymous Coward

          実時間の前処理が必要ということになると、 ネット上のデータのように毎日膨大な量のデータが増えていく状況では使い物にならないなぁ。
          いや、別にインデックス化に実時間と同じ時間がかかるって意味では無くて、検索対象のデータを全てインデックス化が必要だと言う意味と思うぞ。
          つか、一度データ化された音声のインデックス化作業が元々の音声データの実時間がデータの過多以外関係する訳は無い。
          普通のエンコードだって普通にやれば実音声データと同じ時間ピッタリで終わらせる方が難しいのと一緒だろ。
    • by Anonymous Coward
      インデクシングは録音と並行してできないのかなあ……。

      #3ヘッドなカセットデッキを思い出すのでAC
  • by Anonymous Coward on 2008年10月09日 9時35分 (#1434676)
    社員の業務中の会話を検閲します #関連会社なんでAC
typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...