パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

グーグル八分発見システムが未到プロジェクトで採択」記事へのコメント

  • by Anonymous Coward on 2007年07月31日 17時55分 (#1198706)
    すでにBeyond氏は雑誌で、八分発見スクリプトなるものを公開しているわけで、それを拝見する限りでは未踏ではないと思いました。
    スクレイピングとテキストマッチングを行う程度の、スクリプト初心者でもかけるようなものであり、当人も書いていたと思いますが、
    全世界で八分にされていることを検出できないものでした。
    Google Ban Checker [comedywaltz.com]というのも同じ事をやっているものでしょうか。
    そして今回、未踏というからにはgoogleの文字列に頼らない手法で、GoogleのAPIや仕様に頼らないアプローチを提示するということ?
    現在発売中のハッカージャパン3月号に、「Google八分探索スクリプトを作ってみよう!」という記事を書きました。

    これは、グーグル八分表示が出た場合に、具体的にどのページが八分されているのかを調べることが出来るツールを開発する、ノウハウを書いたものです。腕に覚えのある方は、ぜひ読んでみて下さい。付録のDVD-ROMには、実際のツールが収録されていますので、試して遊ぶことも可能です。

    まあ、簡単にいえば、日本の検索結果とアメリカの検索結果を比較するという話なんですが、目視で比較するのは大変なので、プログラムを作ってみましょうということです。

    グーグルで探し物をして満足している人が大部分の今、「グーグルで見つからない情報」を見つける術を知っておくことは、大きなアドバンテージになるかと思います。
    http://beyond.2log.net/akutoku/topics/2007/0215.html
    • by Anonymous Coward on 2007年07月31日 18時05分 (#1198716)
      別に既に公開済みのものを継続開発するのは問題ないですよ。基本的に人材発掘なんだから。まあ、ただ、約一年後の彼の成果が気になるところですね...。
      親コメント
      • by Anonymous Coward on 2007年07月31日 18時29分 (#1198729)
        >公開済みのものを継続開発するのは問題ない
        すでに自力で一度出したものに、公費の支援を求めるのが悪いとは誰もいわないでしょう。
        (OSASKなんかもそういう経緯だったような気がします。)
        その公開済みのアプローチを見聞きする限りでは、そのまんま推し進めたところで
        すぐ煮詰まりそうで人材発掘的な余地が殆どないまま終わってしまう気がします。
        各国の検索結果を比較するというロジックだけでは、広がりがないですよね。
        どこかに、プロジェクトとして長期スパンで見届けようと思わせる、公費をかけて
        やりとげる価値があると思わせるアイデアを盛り込んだと思われるのですけど、、、
        どうでしょうね。
        親コメント
        • by Anonymous Coward on 2007年08月01日 9時52分 (#1199003)
          >公費をかけてやりとげる価値があると思わせるアイデアを
          >盛り込んだと思われるのですけど、、、

          きっと、スパム検索エンジンみたいに公開すると解析されて対策されちゃうから
          未公開なんですよ。
          親コメント
          • >スパム検索エンジンみたいに公開すると解析されて対策されちゃうから未公開

            そういう企業機密的色合い、対策打たれたら終わりという対処療法的かつ非汎用的な
            脆いソリューションは未踏という名目の工費で支援するべきものじゃないよなあ。
            大体、成果は良く解りません、公開できません、公開したら終わりますみたいな、
            そんなやり方で通用するのは内閣機密費とか外交機密費くらいのもんだわ。

            #もちろん、皮肉で書いたのは解ってる。
    • by Anonymous Coward on 2007年08月01日 10時25分 (#1199017)
      たしかにco.jpとcomで「グロービートジャパン株式会社 イオンド大学」で検索したときの結果が30件違ってますね。

      でも、これってgoogleが「現状では」国のドメインごとに八分フィルタをつけてたりそうでなかったりするから
      有効なのであって、仕様変更で使えなくなる可能性がありません?

      最終的には複数の検索エンジンに一度にクエリを放りつつその結果を見るような仕組みになるんですかね。
      千里眼とかODINとかの世代で一度にクエリを放る仕組みは見た気がしますがw
      あとは、その結果を時系列で分析してってところなんですかね。
      親コメント

Stay hungry, Stay foolish. -- Steven Paul Jobs

処理中...