パスワードを忘れた? アカウント作成
10884162 story
Google

Googleストリートビュー向けの画像認識アルゴリズムを使うと非常に高い精度でのCAPTCHAを解読できる 56

ストーリー by hylom
ほこたて勝負 部門より

GoogleはStreet View撮影車で撮影した画像から住所などを読み取るための画像認識アルゴリズムを開発しているそうだ。このアルゴリズムの検証には「CAPTCHA」と呼ばれる、変形させた文字が含まれた画像からその文字や数字などを読み取らせる問題を使っており、開発されたアルゴリズムでは非常に高い精度で文字を読み取れるという(TechCrunch)。

Street Viewでの住所や番地認識では、さまざまな角度から撮影され、またノイズなども含まれる画像から正確に数字を読み取ることが求められる。これはCAPTHAと同様の問題となるそうだ。Googleが開発したアルゴリズムで同社の「reCAPTCHA」問題を解かせたところ、99.8%の精度で正答を導き出せたという。つまり、ほとんどのCAPTCHAを機械的に解くことができてしまうということになる。

今後このようなアルゴリズムやその実装が広く公開された場合、ネット上で操作者がボットでは無いことを調べるために使われているCAPTHAは意味のないものになってしまうかもしれない。そして、それに対抗するためにより高度なCAPTHAが登場することも考えられるそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 精度や手間は別としてPC上で人間にしか出来ないことってあまり思いつかないな

    • 計算を間違えること。

      親コメント
    • by Anonymous Coward on 2014年04月21日 12時44分 (#2586063)

      画像上の重なり合った物体の境目をなぞるとか?

      親コメント
    • by Anonymous Coward on 2014年04月21日 13時17分 (#2586109)

      はてなダイヤリーの「なぞなぞ認証」に答があるような。
      これは「なぞなぞ」とその答を設定して認証に使うものです。
      問「消費税で、自動車及び贅沢品にかかるものは何%でしょう?(解答は半角数字で少数以下二桁まで)」
      答「8.00」
      みたいな。(贅沢品とかはひっかけ。)

      ごくごく初歩的な自然言語理解と推論ですら、今のAIに実行させるのは非常に困難です。

      欠点は答が間違っていたら誰も解答できないとか、
      多くの人が知る社会常識を問う簡単な問題でも、それを知らない人は答えられないとか。

      はてなダイヤリーのコメント欄くらいだと、答えられない人がいても特に問題ないけれど、
      Googleのユーザー登録とかだとどーすんでしょうね。
      #ぐぐれば答が見つかる程度の問題にしておくだけでも十分な気もするけど。

      親コメント
      • 6.30% [mof.go.jp]

        --
        HIRATA Yasuyuki
        親コメント
      • by Anonymous Coward

        時期が指定されてないところが「なぞなぞ」なのかな?

        • by Anonymous Coward

          それだけAIはマヌケだってことだよ。
          いわせんな恥ずかしい

      • by Anonymous Coward

        「ぐぐれば分かる問題を入力させる」を広告にすればさらにマネタイズ可能。
        「このURLで一番お得な商品を探して入力」みたいな。

      • by Anonymous Coward

        大ざると小ざるが喧嘩したら勝つのはどっちだ?
        って問題を出すわけか。

      • by Anonymous Coward

        クイズを解くコンピュータってのをIBMが開発してた(した)らしいんだけど
        なぞなぞには対応できないかな?

        まあ,人間にも対応できない問題も多いからなー
        #回答を列挙してそららの何れかとやんないと正答にならないとか......

    • ねこ認証は期待できそうだと思いませんか?
      http://turi2.net/blog/787.html [turi2.net]

      親コメント
      • by Anonymous Coward
        大量の猫画像を用意するのが難しくない?Google画像検索で集めてきたら本末転倒だし。
      • そのうち、アヒルとウサギの「だまし絵」みたいになるかも。

    • by Anonymous Coward

      普通の画像に写っているものを認識することは未だに機械にはできません。
      精度が低くてよいならできますが、現状は基本的に使い物になりません。

      • by Anonymous Coward

        あまりに出来なさすぎて「これはなに?」というような問題だと作成の機械化が困難なレベルですね。
        画像自体はフリーの素材とかで調達できるだろうけど、正解は人間が入力しなくちゃいけない。
        しかも答えは複数になりえるし。
        #というか大型ダンプの呼び名をリストアップしようとしたらバリエーションがあまりに膨大な事に改めてびっくりした
        #しかし、著作権の問題はあるけどグーグルなら可能かもしれない。

        • ふむ。
          「人間にできて(攻撃)プログラムには難しい問題」は
          「(防御)プログラムにとって、正解を自動判定する(あるいは先に正答をたくさん収集しておく)ことが難しい問題」でもあるんだな。

          どんどん考えていくと「ちゃんと正解を答える」方がPCで「ちょいちょい間違える」のが人間、って考えになってきちゃった。
          長い文章を手打ちさせて、起こりやすいタイプミスの内容から判定するとか。
          ”性能”が高い人間ほど非人間判定されちゃうの。

          親コメント
        • by Anonymous Coward

          機械的に作れる(作りやすい)問題だと機械的に解きやすいということなのでしょうな。

    • by Anonymous Coward

      電源入れたりキーボード叩いたりマウス動かしたりCD入れたりUSBメモリ挿したり…

      • by Anonymous Coward

        人間じゃなくて全部できるじゃん。

    • by Anonymous Coward

      え?
      人間しか考える存在ないのに。

    • by Anonymous Coward

      「あなたのクレジットカードの番号を入力してください」

      たぶん人間にしか出来ない。

      • by Anonymous Coward

        クレカジェネレーターと組み合わせれば出来そう

        • by Anonymous Coward

          それって決済まで出来るの?

  • by Anonymous Coward on 2014年04月21日 12時04分 (#2586015)
    CAPCHA読めたらAIで読めなかったら人間って判断すればいいよ
    • Re:だったら (スコア:2, おもしろおかしい)

      by Anonymous Coward on 2014年04月21日 12時35分 (#2586056)

      えっ?CAPTCHA認証って人の心挫くためのものじゃないの?

      親コメント
      • by Anonymous Coward

        心がくじけたら人間だと判断する

        • by Anonymous Coward

          CAPTCHA認証なんてやってるとおなかがすくじゃないですか、というアンドロイドを人間と認識してしまう恐れが・・・

        • by Anonymous Coward

          判断できたあかつきには、すでにユーザーを失っているけど。

        • by Anonymous Coward

          心がくじけなかったらロボットか、エロい人間だと判断する

    • by Anonymous Coward

      たとえば「1+1=」などの数式を表示して、
      そのまま「1+1=」と入力するか「2」と入力するかで判断するとか

      • by Anonymous Coward

        データ型がテキトーだと、「2」が機械ですね。

        • by Anonymous Coward on 2014年04月21日 12時52分 (#2586072)

          機械は「1+1=10」だろJK

          親コメント
        • by Anonymous Coward

          そんなんだったら`rm -fr /`とか eval とか system とか突っこみたくなる

        • by Anonymous Coward

          人間なら「田」と答えたるんですね

  • by Anonymous Coward on 2014年04月21日 12時22分 (#2586041)

    ・サンプル数は100万らしいのでGoogle以外が用意するのは無理
    ・DNNは専門にしている人でないと扱うのが困難(現時点でハンディーな実装はない)
    ・DNNの学習には高性能なマシンが必要

    これらから公開しても安全って判断したんでしょうかね。
    ただ、わざわざ自社製品の「欠陥」をわざわざ発表したメリットがわかりません。
    reCAPTCHAよりもっとインパクトのあるデータセットはあったはずです。

    • by ryo_jp (9684) on 2014年04月21日 12時47分 (#2586069)

      もはやCAPTCHAはある程度の強度しか無いと判断して内部では既に別のものを用意した結果かも。
      猫認証とか。

      親コメント
      • by Anonymous Coward

        ある程度の強度しか期待出来ないから、「他の要素」と組み合わせて判断するリスク判断器にするわーとは言ってますね。

    • Re: (スコア:0, すばらしい洞察)

      by Anonymous Coward

      じゃあそれが何なのか言い給え。

  • by Anonymous Coward on 2014年04月21日 12時48分 (#2586070)

    現在のreCAPTHAは人間がアクセスして回答している限りは簡単な文字列(数字のみなど)になるように変わってますよね?

    • by Anonymous Coward

      最初は数字だけどすぐにいつもの読めない文字列に変わるよ。
      人間がアクセスしても。
      何百回もアタックしてるとかじゃなく、数回程度で。
      数字でも写真みたいな画像部分が若干見辛い時があるから更新すると、それを数回やっただけで文字列になったりする。

  • by Anonymous Coward on 2014年04月21日 16時54分 (#2586277)

    訴状をいれると判決がでる、googleならできるような気がする

  • by Anonymous Coward on 2014年04月21日 17時34分 (#2586309)

    ストビューの画像(番地とか)が使われてるんでしたよね

    #機械学習させたのではなく、新アルゴリズムってことなのかな?

  • by Anonymous Coward on 2014年04月21日 18時28分 (#2586357)

    既にクラウド突破システムがありますやん。
    えっちなサイトで先に進むために認証させるって聞いたよ!

    • by Anonymous Coward

      CAPTCHAを使っているサイトを収集してデタラメな回答を入れて回り、
      そいつが入力した答えを送ってきたアクセス元には人間にも困難な問題を出すようにする仕組みを追加すればいいのでは。

typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...