Googleストリートビュー向けの画像認識アルゴリズムを使うと非常に高い精度でのCAPTCHAを解読できる 56
ストーリー by hylom
ほこたて勝負 部門より
ほこたて勝負 部門より
GoogleはStreet View撮影車で撮影した画像から住所などを読み取るための画像認識アルゴリズムを開発しているそうだ。このアルゴリズムの検証には「CAPTCHA」と呼ばれる、変形させた文字が含まれた画像からその文字や数字などを読み取らせる問題を使っており、開発されたアルゴリズムでは非常に高い精度で文字を読み取れるという(TechCrunch)。
Street Viewでの住所や番地認識では、さまざまな角度から撮影され、またノイズなども含まれる画像から正確に数字を読み取ることが求められる。これはCAPTHAと同様の問題となるそうだ。Googleが開発したアルゴリズムで同社の「reCAPTCHA」問題を解かせたところ、99.8%の精度で正答を導き出せたという。つまり、ほとんどのCAPTCHAを機械的に解くことができてしまうということになる。
今後このようなアルゴリズムやその実装が広く公開された場合、ネット上で操作者がボットでは無いことを調べるために使われているCAPTHAは意味のないものになってしまうかもしれない。そして、それに対抗するためにより高度なCAPTHAが登場することも考えられるそうだ。
PC上で人間にしか出来ないこと (スコア:2)
精度や手間は別としてPC上で人間にしか出来ないことってあまり思いつかないな
Re:PC上で人間にしか出来ないこと (スコア:3)
計算を間違えること。
Re: (スコア:0)
あなたがお使いのソフトにはバグはなく,ハードは100%の信頼性で動作するんですね
Re: (スコア:0)
演算にバグがあれば、毎回間違った同じ値を出すんじゃないかな。
Re: (スコア:0)
バグは常に人間が埋め込むものであり
ソフトウェア自身が出す結果は与えられた命令に基づいた正常値のみです。
Re: (スコア:0)
その機能はもう20年前 [wikipedia.org]に実現してます。
Re:PC上で人間にしか出来ないこと (スコア:2)
昔のディスクコピープロテクトを思い出した。
Re:PC上で人間にしか出来ないこと (スコア:1)
画像上の重なり合った物体の境目をなぞるとか?
Re:PC上で人間にしか出来ないこと (スコア:1)
はてなダイヤリーの「なぞなぞ認証」に答があるような。
これは「なぞなぞ」とその答を設定して認証に使うものです。
問「消費税で、自動車及び贅沢品にかかるものは何%でしょう?(解答は半角数字で少数以下二桁まで)」
答「8.00」
みたいな。(贅沢品とかはひっかけ。)
ごくごく初歩的な自然言語理解と推論ですら、今のAIに実行させるのは非常に困難です。
欠点は答が間違っていたら誰も解答できないとか、
多くの人が知る社会常識を問う簡単な問題でも、それを知らない人は答えられないとか。
はてなダイヤリーのコメント欄くらいだと、答えられない人がいても特に問題ないけれど、
Googleのユーザー登録とかだとどーすんでしょうね。
#ぐぐれば答が見つかる程度の問題にしておくだけでも十分な気もするけど。
Re:PC上で人間にしか出来ないこと (スコア:2)
6.30% [mof.go.jp]
HIRATA Yasuyuki
Re: (スコア:0)
時期が指定されてないところが「なぞなぞ」なのかな?
Re: (スコア:0)
それだけAIはマヌケだってことだよ。
いわせんな恥ずかしい
Re: (スコア:0)
「ぐぐれば分かる問題を入力させる」を広告にすればさらにマネタイズ可能。
「このURLで一番お得な商品を探して入力」みたいな。
Re: (スコア:0)
大ざると小ざるが喧嘩したら勝つのはどっちだ?
って問題を出すわけか。
Re: (スコア:0)
クイズを解くコンピュータってのをIBMが開発してた(した)らしいんだけど
なぞなぞには対応できないかな?
まあ,人間にも対応できない問題も多いからなー
#回答を列挙してそららの何れかとやんないと正答にならないとか......
Re:PC上で人間にしか出来ないこと (スコア:1)
ねこ認証は期待できそうだと思いませんか?
http://turi2.net/blog/787.html [turi2.net]
Re: (スコア:0)
Re:ねこ認証の未来予測 (スコア:0)
そのうち、アヒルとウサギの「だまし絵」みたいになるかも。
Re: (スコア:0)
普通の画像に写っているものを認識することは未だに機械にはできません。
精度が低くてよいならできますが、現状は基本的に使い物になりません。
Re: (スコア:0)
あまりに出来なさすぎて「これはなに?」というような問題だと作成の機械化が困難なレベルですね。
画像自体はフリーの素材とかで調達できるだろうけど、正解は人間が入力しなくちゃいけない。
しかも答えは複数になりえるし。
#というか大型ダンプの呼び名をリストアップしようとしたらバリエーションがあまりに膨大な事に改めてびっくりした
#しかし、著作権の問題はあるけどグーグルなら可能かもしれない。
Re:PC上で人間にしか出来ないこと (スコア:1)
ふむ。
「人間にできて(攻撃)プログラムには難しい問題」は
「(防御)プログラムにとって、正解を自動判定する(あるいは先に正答をたくさん収集しておく)ことが難しい問題」でもあるんだな。
どんどん考えていくと「ちゃんと正解を答える」方がPCで「ちょいちょい間違える」のが人間、って考えになってきちゃった。
長い文章を手打ちさせて、起こりやすいタイプミスの内容から判定するとか。
”性能”が高い人間ほど非人間判定されちゃうの。
Re: (スコア:0)
機械的に作れる(作りやすい)問題だと機械的に解きやすいということなのでしょうな。
Re: (スコア:0)
電源入れたりキーボード叩いたりマウス動かしたりCD入れたりUSBメモリ挿したり…
Re: (スコア:0)
人間じゃなくて全部できるじゃん。
Re: (スコア:0)
え?
人間しか考える存在ないのに。
Re: (スコア:0)
「あなたのクレジットカードの番号を入力してください」
たぶん人間にしか出来ない。
Re: (スコア:0)
クレカジェネレーターと組み合わせれば出来そう
Re: (スコア:0)
それって決済まで出来るの?
だったら (スコア:0)
Re:だったら (スコア:2, おもしろおかしい)
えっ?CAPTCHA認証って人の心挫くためのものじゃないの?
Re: (スコア:0)
心がくじけたら人間だと判断する
Re: (スコア:0)
CAPTCHA認証なんてやってるとおなかがすくじゃないですか、というアンドロイドを人間と認識してしまう恐れが・・・
Re: (スコア:0)
判断できたあかつきには、すでにユーザーを失っているけど。
Re: (スコア:0)
心がくじけなかったらロボットか、エロい人間だと判断する
1+1= (スコア:0)
たとえば「1+1=」などの数式を表示して、
そのまま「1+1=」と入力するか「2」と入力するかで判断するとか
Re: (スコア:0)
データ型がテキトーだと、「2」が機械ですね。
Re:1+1= (スコア:1)
機械は「1+1=10」だろJK
Re: (スコア:0)
そんなんだったら`rm -fr /`とか eval とか system とか突っこみたくなる
Re: (スコア:0)
人間なら「田」と答えたるんですね
Re: (スコア:0)
※日本人なら
色々と不自然 (スコア:0)
・サンプル数は100万らしいのでGoogle以外が用意するのは無理
・DNNは専門にしている人でないと扱うのが困難(現時点でハンディーな実装はない)
・DNNの学習には高性能なマシンが必要
これらから公開しても安全って判断したんでしょうかね。
ただ、わざわざ自社製品の「欠陥」をわざわざ発表したメリットがわかりません。
reCAPTCHAよりもっとインパクトのあるデータセットはあったはずです。
Re:色々と不自然 (スコア:2)
もはやCAPTCHAはある程度の強度しか無いと判断して内部では既に別のものを用意した結果かも。
猫認証とか。
Re: (スコア:0)
ある程度の強度しか期待出来ないから、「他の要素」と組み合わせて判断するリスク判断器にするわーとは言ってますね。
Re: (スコア:0, すばらしい洞察)
じゃあそれが何なのか言い給え。
すでに現状と違う (スコア:0)
現在のreCAPTHAは人間がアクセスして回答している限りは簡単な文字列(数字のみなど)になるように変わってますよね?
Re: (スコア:0)
最初は数字だけどすぐにいつもの読めない文字列に変わるよ。
人間がアクセスしても。
何百回もアタックしてるとかじゃなく、数回程度で。
数字でも写真みたいな画像部分が若干見辛い時があるから更新すると、それを数回やっただけで文字列になったりする。
google judgement (スコア:0)
訴状をいれると判決がでる、googleならできるような気がする
そもそrecaptchaの問題ソースの一部に (スコア:0)
ストビューの画像(番地とか)が使われてるんでしたよね
#機械学習させたのではなく、新アルゴリズムってことなのかな?
別にそんなのなくても (スコア:0)
既にクラウド突破システムがありますやん。
えっちなサイトで先に進むために認証させるって聞いたよ!
Re: (スコア:0)
CAPTCHAを使っているサイトを収集してデタラメな回答を入れて回り、
そいつが入力した答えを送ってきたアクセス元には人間にも困難な問題を出すようにする仕組みを追加すればいいのでは。