Google、画像からキャプションを作成する技術を開発 20
ストーリー by hylom
視覚障害者の方には有用か 部門より
視覚障害者の方には有用か 部門より
あるAnonymous Coward 曰く、
Googleの研究者が、写真から自動でその状況を説明するようなキャプションを生成するシステムの開発に成功したという(GIGAZINE)。
人間は写真の内容からそれがどういった場面なのかを説明することができる。しかし、同じことをコンピュータにやらせるのは大変だ。開発された技術では、「深層畳み込みニューラルネットワーク(CNN)」を用いた画像認識アルゴリズムと機械学習の技術を採用。さらに、いくつものオープンデータベースの画像を大量に処理させることで、キャプションの質を向上させることにも成功したそうだ。
GIGAZINEの記事では、泥道でオートバイに乗る人やフリスビーで遊ぶ若者の集団といった成功例が紹介されている。いっぽう、その内容を微妙に勘違いしていたり、明らかに解析に失敗した例も掲載されている。
個人向けよりも記録映像の整理に有効かも? (スコア:2)
何が映っているなんていう情報を自動で付けるのに役立つかも知れませんね。
個人利用で考えると見れば分かる事よりも、「何時・何処で・なんの為に」が記録されると良いでしょうけど。
Re:個人向けよりも記録映像の整理に有効かも? (スコア:1)
記録映像の整理だと、キャプションよりタグの方が役立ちそう。
わざわざ文に直す必要もないのでタグのほうが速そうだし、検索もタグのほうがしやすい。
# すでにやってるかはわからないので、もし知っている方がいましたら教えていただけると幸いです
Re: (スコア:0)
NHK放送技術研究所が撮影した映像素材のデータアーカイブ化で、タグを使ったシステムを作っていた(作ろうとしていた?)ような。
メタデータを自動で付けるようなのも研究していたと思うけど、うろ覚え。
Re: (スコア:0)
「何時・何処で」は普通に記録されるようになってますよね。
「なんお為に」はスケジュール帳か日記を小忠実につけているなら、連携させればよさげ。
Re:個人向けよりも記録映像の整理に有効かも? (スコア:1)
Re: (スコア:0)
画像の整理にSpotlightコメントやらOpenMetaタグやら付けてるけど、すんげえ面倒くさい。
多少誤判定してもいいから、こういうのは欲しいですね。
可能性のあるタグは片っ端から付けていいと思う。
余計だと思えばその都度消していけばいいし。
ヒットしないよりは間違ってもヒットする方がマシ。
学習対象をBoketeのデータに限定すれば (スコア:0)
いいボケをかましてくれることを期待。
Re: (スコア:0)
全年齢向け
Re:学習対象をBoketeのデータに限定すれば (スコア:1)
正常:パパがママをいじめてる
騎乗:ママがパパをいじめてる
Re: (スコア:0)
虐待とご褒美はどう区別しましょう?
Re: (スコア:0)
SM:鞭を持ったご褒美をくれる女王様
MS:鞭を持ったザクとは違う青い敵
Re: (スコア:0)
あわび、あわひ、赤貝、あわび、赤貝、ゴバ貝、あわび、あわび・・・・・
それより (スコア:0)
画像で検索する時、勝手にキーワード追加するのやめてくれません?
ネットで拾った写真、どこの写真なのか気になって
画像で検索したら「幻想的」って勝手に追加されて画像まとめしか出てこなかった事がありました
どんな目的で情報収集しているのかが透けて見える (スコア:0)
Goopleさん、いったいどうしたのか
Re: (スコア:0)
透けて見えるのに「いったいどうしたのか」とは
こういうの以前に (スコア:0)
こういうの以前に、画像検索で画像内に写っている文字列(書類の文章とか店の看板とか)が画像検索でヒットするようになればすごく便利だと思うんですが、今回のものよりずっと簡単そうなのにやってくれないんですよね。OCR+αぐらいなんじゃないかと思うんですが。
Re:こういうの以前に (スコア:1)
もじもじくんの画像をアイウエオ順で仕分けするGoogleさんを連想した
Re:こういうの以前に (スコア:1)
アカシック・レコード読み取ったりして。
らじゃったのだ
Re: (スコア:0)
写ってる電柱の住所とか拾ってなかったっけ?
GoogleMapの話だったかな…
Re: (スコア:0)
キャプチャのフリして人間に解析させたり