Google、画像からキャプションを作成する技術を開発

Google、画像からキャプションを作成する技術を開発 20

ストーリー by hylom 2014年11月25日 14時17分
視覚障害者の方には有用か部門より

あるAnonymous Coward 曰く、

Googleの研究者が、写真から自動でその状況を説明するようなキャプションを生成するシステムの開発に成功したという（GIGAZINE）。
人間は写真の内容からそれがどういった場面なのかを説明することができる。しかし、同じことをコンピュータにやらせるのは大変だ。開発された技術では、「深層畳み込みニューラルネットワーク（CNN）」を用いた画像認識アルゴリズムと機械学習の技術を採用。さらに、いくつものオープンデータベースの画像を大量に処理させることで、キャプションの質を向上させることにも成功したそうだ。
GIGAZINEの記事では、泥道でオートバイに乗る人やフリスビーで遊ぶ若者の集団といった成功例が紹介されている。いっぽう、その内容を微妙に勘違いしていたり、明らかに解析に失敗した例も掲載されている。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索20コメント Log In/Create an Account

個人向けよりも記録映像の整理に有効かも？ (スコア:2)

by Lunar5 (39101) on 2014年11月25日 14時45分 (#2716902)

写真やフィルムを保存している施設などでの、
何が映っているなんていう情報を自動で付けるのに役立つかも知れませんね。

個人利用で考えると見れば分かる事よりも、「何時・何処で・なんの為に」が記録されると良いでしょうけど。
- Re:個人向けよりも記録映像の整理に有効かも？ (スコア:1)
  
  by Patilise (45974) on 2014年11月25日 16時13分 (#2716952)
  
  記録映像の整理だと、キャプションよりタグの方が役立ちそう。
  わざわざ文に直す必要もないのでタグのほうが速そうだし、検索もタグのほうがしやすい。
  # すでにやってるかはわからないので、もし知っている方がいましたら教えていただけると幸いです
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    NHK放送技術研究所が撮影した映像素材のデータアーカイブ化で、タグを使ったシステムを作っていた（作ろうとしていた？）ような。
    メタデータを自動で付けるようなのも研究していたと思うけど、うろ覚え。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「何時・何処で」は普通に記録されるようになってますよね。
  「なんお為に」はスケジュール帳か日記を小忠実につけているなら、連携させればよさげ。
  - Re:個人向けよりも記録映像の整理に有効かも？ (スコア:1)
    
    by Lunar5 (39101) on 2014年11月25日 17時20分 (#2717009)
    
    ジオタグの存在をすっかり忘れてたなんて言えませんし……。
    
    シェア
    
    親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  画像の整理にSpotlightコメントやらOpenMetaタグやら付けてるけど、すんげえ面倒くさい。
  多少誤判定してもいいから、こういうのは欲しいですね。
  可能性のあるタグは片っ端から付けていいと思う。
  余計だと思えばその都度消していけばいいし。
  ヒットしないよりは間違ってもヒットする方がマシ。
学習対象をBoketeのデータに限定すれば (スコア:0)

by Anonymous Coward on 2014年11月25日 14時50分 (#2716907)

いいボケをかましてくれることを期待。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  もしかして・・・プロレスごっこ？
  全年齢向け
  - Re:学習対象をBoketeのデータに限定すれば (スコア:1)
    
    by Anonymous Coward on 2014年11月25日 15時20分 (#2716927)
    
    正常：パパがママをいじめてる
    騎乗：ママがパパをいじめてる
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      虐待とご褒美はどう区別しましょう？
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        ＳＭ：鞭を持ったご褒美をくれる女王様
        ＭＳ：鞭を持ったザクとは違う青い敵
- Re: (スコア:0)
  
  by Anonymous Coward
  
  あわび、あわひ、赤貝、あわび、赤貝、ゴバ貝、あわび、あわび・・・・・
それより (スコア:0)

by Anonymous Coward on 2014年11月25日 16時19分 (#2716955)

画像で検索する時、勝手にキーワード追加するのやめてくれません？
ネットで拾った写真、どこの写真なのか気になって
画像で検索したら「幻想的」って勝手に追加されて画像まとめしか出てこなかった事がありました
どんな目的で情報収集しているのかが透けて見える (スコア:0)

by Anonymous Coward on 2014年11月25日 18時52分 (#2717076)

Goopleさん、いったいどうしたのか
- Re: (スコア:0)
  
  by Anonymous Coward
  
  透けて見えるのに「いったいどうしたのか」とは
こういうの以前に (スコア:0)

by Anonymous Coward on 2014年11月26日 0時09分 (#2717228)

こういうの以前に、画像検索で画像内に写っている文字列（書類の文章とか店の看板とか）が画像検索でヒットするようになればすごく便利だと思うんですが、今回のものよりずっと簡単そうなのにやってくれないんですよね。OCR+αぐらいなんじゃないかと思うんですが。
- Re:こういうの以前に (スコア:1)
  
  by nemui4 (20313) on 2014年11月26日 8時30分 (#2717305) 日記
  
  もじもじくんの画像をアイウエオ順で仕分けするGoogleさんを連想した
  
  シェア
  
  親コメント
- Re:こういうの以前に (スコア:1)
  
  by PEEK (27419) on 2014年11月26日 9時54分 (#2717327) 日記
  
  アカシック・レコード読み取ったりして。
  
  --
  らじゃったのだ
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  写ってる電柱の住所とか拾ってなかったっけ？
  GoogleMapの話だったかな…
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    キャプチャのフリして人間に解析させたり

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Google、画像からキャプションを作成する技術を開発 20

Google、画像からキャプションを作成する技術を開発 More ログイン

個人向けよりも記録映像の整理に有効かも？ (スコア:2)

Re:個人向けよりも記録映像の整理に有効かも？ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:個人向けよりも記録映像の整理に有効かも？ (スコア:1)

Re: (スコア:0)

学習対象をBoketeのデータに限定すれば (スコア:0)

Re: (スコア:0)

Re:学習対象をBoketeのデータに限定すれば (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

それより (スコア:0)

どんな目的で情報収集しているのかが透けて見える (スコア:0)

Re: (スコア:0)

こういうの以前に (スコア:0)

Re:こういうの以前に (スコア:1)

Re:こういうの以前に (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

スラド