パスワードを忘れた? アカウント作成
295499 story
Google

Bingに「Googleの検索結果を盗んでいる」疑惑が浮上 127

ストーリー by hylom
ハックかパクリか 部門より

capra 曰く、

BingがGoogleの検索結果をコピーしているのではないかとの疑惑が持ち上がっている(engadgetSearch Engine Land本家/.)。

Googleがこの疑惑を持ち始めたのは、綴り間違いの単語で検索した場合の検索結果が同一になることが多かったからだそうだ。そこでGoogleのエンジニアは存在しない言葉と、その言葉をGoogleで検索した際に表示される「おとり」のページを用意。そしてBingツールバーがインストールされたIEを使い、Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ、2週間後にはBingの検索結果にも同じページが表示されるようになったという。

この「おとり実験」の結果から、GoogleはBingがIEおよびBingツールバーを通じて検索結果をコピーしているとGoogleのエンジニアは主張しているとのこと。

なお、Microsoftはこの主張に対し「ページランキングの手法の詳細は明らかにできない」としながらも、「我々を含め全ての検索エンジンがサイトのランキングのために利用するインプットの一つとして、(Bingの)ツールバーはクリックストリームデータを提供している。Googleによるこの「実験」はこのようなインプットシグナルの利用を操作し混乱させるようなハックのように思える」と反論しているそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 問題あるの? (スコア:3, すばらしい洞察)

    by mik_naruto (26947) on 2011年02月03日 18時40分 (#1897952)

    >Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ

    これ、おかしくない?
    本当に検索結果を検索結果として盗んでいるなら、せめて「おとりページをクリックせず、Googleの検索結果画面を表示した」だけの状態で、おとりページがBingに捕捉される、くらいのことは言ってくれないと。
    じゃなくて、Bingのツールバーを入れた状態で、おとりページを"実際に閲覧した"んであれば、その閲覧したページのことをBingが知ってたって、ひとまず問題ないのでは(ユーザの同意を得てるならプライバシー関連の問題はとりあえずおいとく)。
    それともGoogleを経由して閲覧されたあらゆるページは除外されるべきだとでも? そんなことはむしろ不可能。

    • by kousokubus (37099) on 2011年02月03日 22時32分 (#1898091)

      おかしくないよ。

      0. mbzrxpgjys でBing検索して match 0 なのを確認
      1. googleに mbzrxpgjys で検索すると RIM Company(www.rim.com) が出てくるようにhonypotセット
      2. Bing ツールバーのインストールされたIEで、 mbzrxpgjysをググる
      3. mbzrxpgjys の検索結果で出てくる www.rim.com をクリックする
      4. しばらく待つ
      5. Bingで mbzrxpgjys で検索すると www.rim.com が出てくる

      これは検索結果を盗んでると言えるんでないかな。
      閲覧したページのことをBingが知ってても問題ないかも知れない。
      だからRIM CompanyでBing検索して、www.rim.comが出てきても問題ない。
      でも、mbzrxpgjysでBing検索して出てくるなら「Googleを経由して閲覧されたページを覚えた」んではなくて「Googleでmbzrxpgjysで検索したという情報とヒモづけて、そのクリック先を覚えた」という事になる。
      このヒモ付けが問題。
      「むしろ不可能」じゃなくて「明確にやってないと可能にならない」事だよ。

      www.rim.comを覚えたんじゃなくて、何やったらwww.rim.comが出てくるかとヒモ付けて覚えるのは、検索結果のカンニングだcheatingだって言われてもしょうがないんじゃないかなあ。

       # この手法だとGoogle検索+人の判断が入るから、より効率よく検索結果を洗練できるね。
       # まあ完コピじゃなくて1割以下っぽいし、こっそりテストしてたのがバレたってとこじゃないかな:-P

      親コメント
    • 別ドメインにGoogleを用意して、そっちで同じことやって、
      偽Googleでの検索結果はBingに反映されなかったなら、怪しいかも。

      --
      1を聞いて0を知れ!
      親コメント
  • by reininn (35924) on 2011年02月03日 18時45分 (#1897954)
    もっとストレートに、存在しない嘘のページを Google の検索結果として出すようにして
    しばらくして Bing が検索結果として出して来たら明らかだったんでしょうね。
    • どうやってその存在しないウソのページをBingに拾わせるのさ?

      今回のは、Bingツールバーがユーザの行動を報告してる情報を元にインデックス作ってるって話だろうし。
      それに、いくらBingのエンジニアがうっかりしててもGoogleの検索結果に出てくるサイトが404だったり存在しないかどうか位は確認するだろ。
       # まあ今回のだって検索文字列が覚えるページ内に存在してるかどうかをチェックするだけでバレなかった行動なので、確認しない可能性はあるけど:-P

      親コメント
  • by chocopa (14067) on 2011年02月04日 8時34分 (#1898273)

    IME2002で「ぎれ」を変換すると「ピカチュウ」になるのですが、
    これも辞書の不正コピー対策と言われていますね。

  • by Anonymous Coward on 2011年02月03日 18時09分 (#1897929)

    ゴミだらけの検索結果を何とかしろ。仮にBingがGoogleの検索結果をコピーしてるとしたら、Bingのほうがspam除去技術ではるかに上を行ってるってことじゃん。
    公式サイトよりコピペspamアフィサイトのほうがGoogleにより多くの広告収入をもたらすからこれは意図した結果なんだっけ。競争相手がいればそこまで露骨にそんな悠長なことはしてられなかったはずだからやっぱり独占はろくな結果をもたらさないな。

  • by Anonymous Coward on 2011年02月03日 18時14分 (#1897930)
    Googleのツールバーだって何してるかわかんねーしw
  • by Anonymous Coward on 2011年02月03日 18時17分 (#1897932)

    誰かがそれを検索すると、Googleのページが出て来るのが正解なんじゃ?

  • by Anonymous Coward on 2011年02月03日 18時19分 (#1897935)
    「見られて困るものはインターネットに公開するな」ってのが基本姿勢じゃなかった?
    • それに関しては、見るのはいいけど出典を明らかにすべきって話でないの?

      親コメント
      • by cv (41694) on 2011年02月04日 1時08分 (#1898176)

        >見るのはいいけど出典を明らかにすべきって話でないの?

        検索された対象については、それは言えるだろうけど、どこで検索したかの表示義務は難しいのと違う?
        それを言ったら、ある本からの引用で、その本をどこで買ったか?見たか?の情報開示も義務付けされちゃうよね。
        何かしら「そういう情報があった」という情報については、著作権的にどうなんでしょうね?

        親コメント
        • クローラー型の検索エンジンで検索結果のページがひっかかるってのは時々あって、そういう事例は別にいい。
          #検索結果は自動生成ページだろうからrobots.txtで避けておくのが基本だろうし。

          けど自社がクロールして検索した結果じゃなく、他社のクロール&検索結果を、
          キーワードをスパイして自分の検索結果一覧に混ぜる(クロールはし直すにしても)のはちょっとなぁ。
          法的義務ではないとしてもあんまりフェアとはいえない気がするな。
          #法にしても著作権だけでなく不正競争防止とかの観点もあり得るし。

          それにBingツールバー使って入力してるのでない時に
          余所のページの入力フィールドを見ると言うのはプライバシー保護的にもグレーっぽい。
          #ツールバー使ってる時でも入力内容の利用がプライバシー・ポリシーに明示されてる範囲を超えると問題。

          最初から複数のエンジンを串刺すメタ検索か何かで、
          その検索対象にGoogleが入ってるとかならわかるが、
          それはそれで表明しておくのがフェアだと思うし、
          結果もどこ由来か表示するのは無理じゃないし、フェアでもある。

          ところで元の記事(#1897940)は(#1897935)という表明に対する一般的な話で、
          見るのも利用するのもかまわなくても引用・利用の仕方に問題があることはあろうって話。
          例えば秘密情報でなくても余所のコンテンツを自分の所のコンテンツの様な顔してframeに取り込むとかはフェアなやり口とは思えない。
          #frameの場合はtarget指定し忘れるという過失でそういう表示になることはあるが。

          親コメント
  • by Anonymous Coward on 2011年02月03日 18時24分 (#1897938)

    手元に鯖があるんだし、該当するセグメントのパケットをキャプるとかしたほうが良かったんちゃうんかしら
    事実を解析せず実体験だけで「パクリだ!」って声高に言っても説得力ないお。残念ながらmsに言い分がある気が。

    まぁ実際のところはパクってると思うケードーネー

  • by Anonymous Coward on 2011年02月03日 18時28分 (#1897941)
    Googleが作った約100個の罠のうち、Bingに反映された(Googleの主張では盗まれた)のはたった7~9個。
    わずか1割にも満たない結果を持ってこの主張をするのはちょっと苦しいのでは。
    • by Anonymous Coward

      でも存在しない単語の検索結果はどこから生まれたの?
      なぜそれが人為的に作られた Google のそれと一致するの?

      #お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。
      #わずか1割にも満たない結果を持ってこの主張をするのは(略

  • by Anonymous Coward on 2011年02月03日 18時37分 (#1897949)

    ちゃんとロボット避けしてないからだな。
    NOINDEXてちゃんと入っている?

    #Bingの検索はGoogleを避けるとは成って無いだろうからね。

    • by Anonymous Coward

      タレコミのどこにロボットの話が出ているのか?

      > BingツールバーがインストールされたIEを使い
      って書いてあるぜ。

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...