アカウント名:
パスワード:
でも存在しない単語の検索結果はどこから生まれたの?なぜそれが人為的に作られた Google のそれと一致するの?
#お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。#わずか1割にも満たない結果を持ってこの主張をするのは(略
「Googleの検索結果画面から結果を直接的に複製した」なら問題だけど、「(偶然Google経由で、偶然Google経由でしか辿り着けない)とあるページを閲覧し、そのURLがBingツールバーの機能としてユーザの同意を得てMSに送信され、それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、Bing側でも検索結果に含まれるようになった」なら、何の問題もない。
Googleが表示していた検索結果のうちわずかしかBing側に含まれてないというのが事実なら、裏で起きていたことが前者じゃなく後者であったということを示唆するように、自分には思える。
ドメインすら違うURLを「Google経由で検索して辿り着いたから」というだけの理由でBingがクロール遠慮する必要はないでしょ?Googleの検索結果に表示されるページは全部Googleのものだと言いたいなら、とんだジャイアニズムだ。
それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、
それは Google が実験したこととは異なる。 Google で「妙な単語」を検索すると、ある URL が表示される。 その URL は実在するウェブページを指しているが、その中をいくら調べても 「妙な単語」はそこには存在していない。 つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。 これでは、「Bing は Google Search の出力結果を参照して出力を改善している」と 非難されても止むを得ない。
つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。
ダウト 今回の実験では
Googleでこの言葉を検索した上で検索結果として表示されるおとりページをクリックしたところ
という実験をしているので「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には ユーザが「クリックした」という関連ができている (Bing のツールバーに(わざと?)ユーザの行動履歴を収集させている)。 この件はほぼ間違いなく Google のいいがかりでしょう。 それどころか、Google Toolbar も (PageRank とか表示するように設定してると) ユーザの行動履歴を収集しているわけだから、 Microsoft に同様の実験をされたらブーメランがかえってくる可能性が高そう。
「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には ユーザが「クリックした」という関連ができている
そう解釈した場合、「妙な単語」と「URL」とを関連づけてくれたのは Google Search だ。 ユーザーは表示された検索結果の中のどれかをクリックすることしかしていない。 関連があるという情報を提供したのは Google Search であり、ユーザーは受け手の立場だ。 そのとき、Bing ツールバーというものが介在して「Google Search からユーザーが 受取った情
スラドとか各所の掲示板でRjeallkzznewwetter [nhk.or.jp]という単語をNHKにリンクしまくり、1週間後にGoogleやBingの検索結果でRjeallkzznewwetterを検索するとNHKが上位に出てくるようになった場合、これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?それを情報の泥棒だと呼ぶなら、世の中の検索エンジンのアルゴリズムの前提が全部崩壊するのは分かるよね?
今回はそれが偶然Googleの検索結果ページだったわけだ。何しろそこにしか出さないというあり得ない状況を、意図的にGoogleが仕組んだんだから、Bingとしてはそれ以外に参考に出来る情報なんて何にもない。なんでその場合に限ってGoogleから泥棒されたとか言わなきゃいけないの?
これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?
もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように 構成されているとしたら、盗んだことになるだろう。辞書を編纂するときに 他の辞書の説明をコピーしたらアウト。文学作品などから引用するのは OK。
もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように構成されているとしたら、盗んだことになる
検索機能のあるサイトかどうかは重要ではないでしょ。それは論点が全く違う。だいたい検索機能の有る情報サイトをインデックスして盗用だというなら、Googleが難しい単語に対してWikipediaや英和辞書サイトの記事を上位に表示してくるのも全部剽窃になるぞ。
そうじゃなくて、今の問題はあくまで、リンク情報やページ遷移情報。BingがクエリをそのままGoogleに投げてその結果をオウム返ししてるとかなら泥棒だけど、ユーザのページ遷移の
今までのレスとは違う人ですけど
Bingが「これは知らないページだぞ、ユーザはどうしてどんなページに辿り着いたんだろう」と思ったときに、リンク元を辿ったら偶然Googleだとしても、なぜそこで解析を中断する必要があるの?
Googleを特別扱いしなければ移動元(Google検索)と移動先の関連はURLで言えば1. www.google.com/search?q=検索文字列&ie=文字コード&検索ソース2. www.rim.comBingには上記の関連性しか送られない。
しかし mbzrxpgjys 文字列を「Google」とか「文字コード」の除外でBing検索してもおそらくヒットする事になると思われます。つまりGoogle検索であることを特別視して「検索文字列」を抜き出してBing検索に利用してるって事になりませんか?
# 100%悪だとは思わないがやっぱまずいだろうとは思う。
しかし mbzrxpgjys 文字列を「Google」とか「文字コード」の除外でBing検索してもおそらくヒットする事になると思われます。
それは Bing が Google を特別扱いしている証拠にはなり得ない。 "mbzrxpgjys" などという単語は他にはどこにも存在していなかった単語なのだから。 もしも「文字コード」や「Google」という文字列が他にどこにも存在していないか、 もしくはそれらの文字列を含む URL やページの全てがリンク先 "www.rim.com" と関連していたとしたら、 「Google」という語だ
IEのツールバーが情報を送っていたとして、そこからわかるのは「mbzrxpgjysを検索した結果のGoogleのページ」から「www.rim.com のページ」に飛んだということまでです。ここで、最近の検索エンジンは、リンク元のページからも www.rim.com に関連するキーワードを抽出しているわけですが、検索結果のページに出てくる全ての単語に対し、www.rim.com に関連づけるようなことをしては、まともな検索データベースにはなりません。ある程度不要な単語は捨てて、www.rim.com へのリンク部分と密接に関係する単語だけを抽出して関連づける必要があるわけです。
ところが
単語同士の関連を抽出するのが目的なら、そのページの主題がmbzrxpgjysである可能性が高いと汎用的に認識できれば十分であり、他社の検索結果ページであるとまで認識する意味はない。そのルーチンが「検索エンジンとはっきり認識してるに違いない」まで言い切っちゃうのは無理があるかと。そして少なくともmbzrxpgjysでググった結果ページの<title>タグ内に、もろmbzrxpgjysが出てくるんだから、それだけで簡単にmbzrxpgjysについてのページだと分かる。まあ裏でどんな解析してるのかの詳細は検索サイトにとってトップシークレット(ばらしたらランク操作される)だから、これ以上は誰にも否定も肯定もできない気がする。
まあ、どこかで検索ページを検索ページと認識してること自体は確か。Bingの検索結果にGoogleの検索結果ページ自体は決して出てこない、とか、そういう除外は当然してるよね。
「mbzrxpgjysが主題である」ページからのリンクだからというだけで、リンク先の「www.rim.com」も「mbzrxpgjysに関係している」と見なすのは効果が低いかと思います。/.jのトップからリンクされているページは全て「スラッシュドットジャパン」というキーワードに関連づけられているのでしょうか?
「リンク元のページの主題」と「そのページからのリンク先」を関連づけるというのなら、検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。直接辿ったという実績情報が無いという点ではランクは下がるかもしれませんけど、まったく一覧に出てこないというのは不可解です。ところが、bingでの mbzrxpgjysの検索結果にwww.rim.com以外は現れていません。
検索結果と認識して無関係なリンクを排除しているとしか思えません。
検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。
まだ分かってないようですね。 "google map など他のサービスへのリンクだとか広告へのリンク" とかそういった単語は他の多くのページでも使われてるでしょ? でも今回の "mbzrxpgjys" は、偽の検索結果にしかあらわれてないわけ。 だから関連性が相対的に高いと判断しても全然不自然じゃない。 分かりました?
> "google map など他のサービスへのリンクだとか広告へのリンク"> とかそういった単語は他の多くのページでも使われてるでしょ?
論点がずれています。それは、「mbzrxpgjys以外の単語」からwww.rim.com へのリンクが現れない理由にはなりますが、「mbzrxpgjys」という単語から google map へのリンクが現れない理由にはなりません。
maps.google.com へのリンクが他の多くのページに使われているのと同様に、www.rim.com へのリンクも、他のページでも使われていますね。
そして、「mbzrxpgjys という偽の検索結果からリンクされている」という点だけ見れば、maps.google.com も www.rim.com も同格です。
「mbzrxpgjys」という単語から google map へのリンクが現れない理由にはなりません。
だからなるって指摘されてる [srad.jp]じゃん。 "mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、 "mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。 君が超初歩的な検索アルゴリズムについてすら理解できてないのは皆十分わかったから いい加減無知をさらすのはやめておけば?
なんか議論がループしてますが、今回の実験の場合、「mbzrxpgjysで検索した結果」はフェイクですが、www.rim.com は実在のサイトです。
> "mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、> "mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。
同様に、
"mbzrxpgjys" という単語以外と"www.rim.com" という単語の関連性が高ければ、 "mbzrxpgjys" で検索した結果での www.rim.com のランクが高くなるわけないじゃん。
とも言えますよ。
google map と www.rim.com の違いは、・IE toolbar によって「 www.rim.com の方は実際リンクを辿った実績がある」と判明しているという点ですが、これはBingでの mbzrxpgjys の検索結果で www.rim.com が上位に来る理由にはなるかと思いますが、だからといって google map の方が結果に表れないのは、一般的なWeb解析結果と言うには不可解だ、というのが私の主張。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
開いた括弧は必ず閉じる -- あるプログラマー
割合が低いのでは (スコア:0)
わずか1割にも満たない結果を持ってこの主張をするのはちょっと苦しいのでは。
Re: (スコア:0)
でも存在しない単語の検索結果はどこから生まれたの?
なぜそれが人為的に作られた Google のそれと一致するの?
#お前が無くした約100本のボールペンのうち、上司の机から出てきた(お前の主張では盗まれた)のはたった7~9本。
#わずか1割にも満たない結果を持ってこの主張をするのは(略
Re: (スコア:0)
「Googleの検索結果画面から結果を直接的に複製した」なら問題だけど、
「(偶然Google経由で、偶然Google経由でしか辿り着けない)とあるページを閲覧し、
そのURLがBingツールバーの機能としてユーザの同意を得てMSに送信され、
それを後からBingのロボットがクロールし、その中に含まれていた妙な単語をBingが新規語として認識し、
Bing側でも検索結果に含まれるようになった」なら、何の問題もない。
Googleが表示していた検索結果のうちわずかしかBing側に含まれてないというのが事実なら、
裏で起きていたことが前者じゃなく後者であったということを示唆するように、自分には思える。
ドメインすら違うURLを「Google経由で検索して辿り着いたから」というだけの理由で
Bingがクロール遠慮する必要はないでしょ?
Googleの検索結果に表示されるページは全部Googleのものだと言いたいなら、とんだジャイアニズムだ。
Re: (スコア:1)
それは Google が実験したこととは異なる。
Google で「妙な単語」を検索すると、ある URL が表示される。
その URL は実在するウェブページを指しているが、その中をいくら調べても
「妙な単語」はそこには存在していない。
つまり、「妙な単語」と「URL」とを関連づける情報は Google Search の中にしかない。
これでは、「Bing は Google Search の出力結果を参照して出力を改善している」と
非難されても止むを得ない。
Re: (スコア:0)
ダウト
今回の実験では
という実験をしているので「Googleの検索結果のページ (つまり「妙な単語」が含まれるページ)」と「URL」の間には
ユーザが「クリックした」という関連ができている (Bing のツールバーに(わざと?)ユーザの行動履歴を収集させている)。
この件はほぼ間違いなく Google のいいがかりでしょう。
それどころか、Google Toolbar も (PageRank とか表示するように設定してると) ユーザの行動履歴を収集しているわけだから、
Microsoft に同様の実験をされたらブーメランがかえってくる可能性が高そう。
Re: (スコア:1)
そう解釈した場合、「妙な単語」と「URL」とを関連づけてくれたのは Google Search だ。
ユーザーは表示された検索結果の中のどれかをクリックすることしかしていない。
関連があるという情報を提供したのは Google Search であり、ユーザーは受け手の立場だ。
そのとき、Bing ツールバーというものが介在して「Google Search からユーザーが
受取った情
Re: (スコア:0)
スラドとか各所の掲示板でRjeallkzznewwetter [nhk.or.jp]という単語をNHKにリンクしまくり、
1週間後にGoogleやBingの検索結果でRjeallkzznewwetterを検索するとNHKが上位に出てくるようになった場合、
これは「GoogleやBingがスラドから情報を盗んだ」ことになるの?
それを情報の泥棒だと呼ぶなら、世の中の検索エンジンのアルゴリズムの前提が全部崩壊するのは分かるよね?
今回はそれが偶然Googleの検索結果ページだったわけだ。何しろそこにしか出さないというあり得ない状況を、
意図的にGoogleが仕組んだんだから、Bingとしてはそれ以外に参考に出来る情報なんて何にもない。
なんでその場合に限ってGoogleから泥棒されたとか言わなきゃいけないの?
Re: (スコア:1)
もしもスラドが、数十万以上のキーワードに対して役に立つ検索結果を返すように
構成されているとしたら、盗んだことになるだろう。辞書を編纂するときに
他の辞書の説明をコピーしたらアウト。文学作品などから引用するのは OK。
Re: (スコア:0)
検索機能のあるサイトかどうかは重要ではないでしょ。それは論点が全く違う。だいたい検索機能の有る情報サイトをインデックスして盗用だというなら、Googleが難しい単語に対してWikipediaや英和辞書サイトの記事を上位に表示してくるのも全部剽窃になるぞ。
そうじゃなくて、今の問題はあくまで、リンク情報やページ遷移情報。
BingがクエリをそのままGoogleに投げてその結果をオウム返ししてるとかなら泥棒だけど、ユーザのページ遷移の
逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:0)
今までのレスとは違う人ですけど
Googleを特別扱いしなければ移動元(Google検索)と移動先の関連はURLで言えば
1. www.google.com/search?q=検索文字列&ie=文字コード&検索ソース
2. www.rim.com
Bingには上記の関連性しか送られない。
しかし mbzrxpgjys 文字列を「Google」とか「文字コード」の除外でBing検索してもおそらくヒットする事になると思われます。
つまりGoogle検索であることを特別視して「検索文字列」を抜き出してBing検索に利用してるって事になりませんか?
# 100%悪だとは思わないがやっぱまずいだろうとは思う。
Re: (スコア:0)
それは Bing が Google を特別扱いしている証拠にはなり得ない。
"mbzrxpgjys" などという単語は他にはどこにも存在していなかった単語なのだから。
もしも「文字コード」や「Google」という文字列が他にどこにも存在していないか、
もしくはそれらの文字列を含む URL やページの全てがリンク先 "www.rim.com" と関連していたとしたら、
「Google」という語だ
Re: (スコア:1)
IEのツールバーが情報を送っていたとして、そこからわかるのは
「mbzrxpgjysを検索した結果のGoogleのページ」から「www.rim.com のページ」に飛んだ
ということまでです。
ここで、最近の検索エンジンは、リンク元のページからも www.rim.com に関連するキーワードを抽出しているわけですが、
検索結果のページに出てくる全ての単語に対し、www.rim.com に関連づけるようなことをしては、まともな検索データベースにはなりません。
ある程度不要な単語は捨てて、www.rim.com へのリンク部分と密接に関係する単語だけを抽出して関連づける必要があるわけです。
ところが
Re: (スコア:0)
単語同士の関連を抽出するのが目的なら、そのページの主題がmbzrxpgjysである可能性が高いと汎用的に認識できれば十分であり、他社の検索結果ページであるとまで認識する意味はない。そのルーチンが「検索エンジンとはっきり認識してるに違いない」まで言い切っちゃうのは無理があるかと。
そして少なくともmbzrxpgjysでググった結果ページの<title>タグ内に、もろmbzrxpgjysが出てくるんだから、それだけで簡単にmbzrxpgjysについてのページだと分かる。
まあ裏でどんな解析してるのかの詳細は検索サイトにとってトップシークレット(ばらしたらランク操作される)だから、これ以上は誰にも否定も肯定もできない気がする。
まあ、どこかで検索ページを検索ページと認識してること自体は確か。Bingの検索結果にGoogleの検索結果ページ自体は決して出てこない、とか、そういう除外は当然してるよね。
Re: (スコア:1)
「mbzrxpgjysが主題である」ページからのリンクだからというだけで、リンク先の「www.rim.com」も「mbzrxpgjysに関係している」と見なすのは効果が低いかと思います。/.jのトップからリンクされているページは全て「スラッシュドットジャパン」というキーワードに関連づけられているのでしょうか?
「リンク元のページの主題」と「そのページからのリンク先」を関連づけるというのなら、
検索結果ページにあるgoogle map など他のサービスへのリンクだとか広告へのリンクも、mbzrxpgjysと関連づけられるはずです。
直接辿ったという実績情報が無いという点ではランクは下がるかもしれませんけど、まったく一覧に出てこないというのは不可解です。
ところが、bingでの mbzrxpgjysの検索結果にwww.rim.com以外は現れていません。
検索結果と認識して無関係なリンクを排除しているとしか思えません。
Re: (スコア:0)
まだ分かってないようですね。
"google map など他のサービスへのリンクだとか広告へのリンク"
とかそういった単語は他の多くのページでも使われてるでしょ?
でも今回の "mbzrxpgjys" は、偽の検索結果にしかあらわれてないわけ。
だから関連性が相対的に高いと判断しても全然不自然じゃない。
分かりました?
Re: (スコア:1)
> "google map など他のサービスへのリンクだとか広告へのリンク"
> とかそういった単語は他の多くのページでも使われてるでしょ?
論点がずれています。それは、「mbzrxpgjys以外の単語」からwww.rim.com へのリンクが現れない理由にはなりますが、
「mbzrxpgjys」という単語から google map へのリンクが現れない理由にはなりません。
maps.google.com へのリンクが他の多くのページに使われているのと同様に、
www.rim.com へのリンクも、他のページでも使われていますね。
そして、「mbzrxpgjys という偽の検索結果からリンクされている」という点だけ見れば、maps.google.com も www.rim.com も同格です。
Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:0)
だからなるって指摘されてる [srad.jp]じゃん。
"mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、
"mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。
君が超初歩的な検索アルゴリズムについてすら理解できてないのは皆十分わかったから
いい加減無知をさらすのはやめておけば?
Re:逆にGoogleを特別扱いしてる(Re:割合が低いのでは) (スコア:1)
なんか議論がループしてますが、
今回の実験の場合、「mbzrxpgjysで検索した結果」はフェイクですが、www.rim.com は実在のサイトです。
> "mbzrxpgjys" という単語以外と"google map" という単語の関連性が高ければ、
> "mbzrxpgjys" で検索した結果での google map のランクが高くなるわけないじゃん。
同様に、
"mbzrxpgjys" という単語以外と"www.rim.com" という単語の関連性が高ければ、
"mbzrxpgjys" で検索した結果での www.rim.com のランクが高くなるわけないじゃん。
とも言えますよ。
google map と www.rim.com の違いは、
・IE toolbar によって「 www.rim.com の方は実際リンクを辿った実績がある」と判明している
という点ですが、これはBingでの mbzrxpgjys の検索結果で www.rim.com が上位に来る理由にはなるかと思いますが、
だからといって google map の方が結果に表れないのは、一般的なWeb解析結果と言うには不可解だ、というのが私の主張。