パスワードを忘れた? アカウント作成
15224 story
Google

Google、閲覧履歴を記録・検索するWeb Historyを開始 39

ストーリー by yoosee
ある意味、究極のプライバシー 部門より

Anonymous Coward 曰く、

Google 公式ブログの記事 Your slice of the web にて Web History というサービスを開始したことがアナウンスされている。 Search History を改良したもののようで、使うには Googleアカウント、及び Page Rank を有効にした Google Toolbar が必要。
使ってみると分かるが、検索を含めて過去の自分がどんな行動を取っているのか丸分かりで、 これを見るとさすがに引いてしまう。Googleは怖いですね。

名前の通り、Web 閲覧の History (履歴) を記録して後から検索可能にするサービス。「あれ、あの情報はどこで見たっけ?」と言ったときに、自分の閲覧履歴を対象として検索することが出来る。先行して提供されていた検索履歴の検索機能 Search History はこれに統合される形になるようだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by oltio (3848) on 2007年04月21日 0時51分 (#1145925) 日記
    >キモい・怖い
    まぁまぁ、そう言いたくなる気持ちはわかりますが、FAQ [google.com]を読むとさすがにその辺が気になる人が多いのはわかっているようで。

    Q.2: どうやったら Web History からアイテムを消せるの?
    Q.4: どこにデータは保存されるの?
    A.4: Google のサーバです(以下略)
    Q.5: サインアップしてないのでなんで Web History が使えるの?
    A.5: Google Account にサインアップすると自動的に Web History を含むサービスが使えるようになります(略)
    Q.7: 他の人が自分の Web History を見れるのか?
    A.7: Google Account の ID さえあれば(意訳)。

    Q.5は注意かな。すでに Google Account を持っている場合には、勝手に追加されることはないようです。

    • >Q.2: どうやったら Web History からアイテムを消せるの?

      これに対応する A.2 がない。やっぱりキモい・怖い。

      # 単なる茶々なので AC
      • 基本的に、他人に一度与えた情報は絶対に消せないです。
        FAQに書いてある方法で操作してもユーザー(自分)から見えなくなるだけで、Googleのデータベースから消去される保証はないし、実際のところ消去されないでしょう。
    • >A.7: Google Account の ID さえあれば(意訳)。
      意訳になってないよ。
      自分のユーザー名とパスワードを他人と共有した場合。ここ抜けたら駄目でしょ・・・。
  • by Anonymous Coward on 2007年04月21日 14時42分 (#1146178)
    >Web 閲覧の History (履歴) を記録して後から検索可能にするサービス

    それこそGoogleや第三者に見られるかも知れなくて怖いっていう点と、あと近年のHDDの巨大化(安価化)の恩恵を考えると、ローカルでやっちゃえばいいんじゃないの?と思うんですが。

    私がよく思うのは、

    ●自分のパソコン(数台で共用してもいいが)で
    ●閲覧したWebサイトを
    ●URLおよび時刻ごとに
    ●全部記録しておいて(つまり同URLなら「バージョン管理」をすることになる)
    ●あとからURLと時刻を指定すれば
    ●それを読み出せる

    っていうソフトです。

    以前はWebキャッシュソフトのキャッシュ保持時間を無限大に設定して

    ●URLごとに全部記録

    っていうのを使っていたんですが、これだと刻々更新されるサイトを閲覧すると過去の情報を上書き消去してしまうのであまり役立たないってのと、あと数年前だったのでHDDがたちどころに一杯になってしまった(^^;ってのがあって、やめてしまいました。

    素朴に考えれば自分のパソコン(自宅LANの中のパソコンのどれかでも可)にそういうプロキシソフトを立てればいいだろうなと思っています。
    クイックハックで作ってみたいなあと思っています。
    原理的にはおそらく簡単で

    ●Webアクセスされるたびに、URLに一対一対応したファイルを(HDDに)保存
    ●保存したファイルをSubversionか何かにチェックイン
    ●チェックインした奴を閲覧するための別の口も用意しておく

    で出来ると思うんですが、難点がひとつあって、

    ●ファイル名として受け付けてもらえないくらい馬鹿長いURL

    をどう処理するか?のいいアイデアがまだ無い状態です。
    どなたか、
    「ファイル(名)を経由せずにチェックイン/アウトできるバージョン管理ツール」
    が有ったら教えてください。
    名前(のような属性)は好きなだけ長く複雑なものをつけてもいいってことにして、
    あとファイル内容のような実データはストリームなどで直接やりとりってことで。
    • Windows だったら Unicode 版 API を使っていればファイル名は MAX_PATH の制限から約 32,000 文字まで増えますので、大抵は URL そのままでも入るのではないでしょうか。

      ANSI 版 API を使ってるアプリとかだとアウトですが。

      親コメント
    • ファイル名をURLのハッシュ(最長128バイト程度、Filesystem Safeな文字限定)にすれば良いんじゃない。
      まあそうすると単なるバージョン管理ソフトだけでは実現できないかもしれないけど。
      • >ハッシュ(最長128バイト程度

        やっぱりその辺になりますかね。

        リアルなURLでファイルを探すのが難渋しそうですが、
        考えたら探すときも同じハッシュ式で変換かけて探せばいいか。
        (あいまい検索が心配だが)

        あとURLそのものの記録は、たとえばSubversionだと
        「属性」を食わせればいいかな。

        1つのフォルダにファイルを大量に放り込むと遅くなったりするから、
        128バイトを数段に区切ってフォルダ階層を作ればいいですね。

        まあそういう風に妥協すれば
        何とかなりそうですね。作ってみよっかな。

        >バージョン管理ソ
    • プロキシのキャシュを全文検索できるようにする、というシステムをオープンソースなもので組み合わせで作る、という話は、探すとあちこちでみつけられます。こういうのがあればよい?
      • TOPです。

        全文検索も欲しいですが、一方で過去情報の保持も欲しいと思っています。前述したように上書きされると(私としては)価値が半減なので。過去保持を実現してる「話」は、たとえばどんなのが有るでしょう?あまり見かけない気がするのですが。

        なお、もちろん両方あわせて「過去」の「検索」が出来るのが理想です。そういえばCVSやSubversionで記録した過去バージョンの検索ってのはあまり聞きませんね。CVSWebとかでWeb化したうえでWeb検索エンジンにかけるっていう二度手間なら見かけますが、それだと(今回の話から離れますが)ローカルで開発してるときに鬱陶しい。そもそもプログラマのみなさんは「xxxって単語を消したのはいつだったかな」って調べるときどうしてるんでしょうか?そのためだけにWebサーバを立てたり?

        これがPlan9だとリポジトリもディレクトリツリーとして見せてくれるのかな。だとすれば普通のgrepだろうがなんだろうが使い放題なわけですが。
        • それ実現すると
          お前は何月何日~何月何日の間に×××という修正を加えた。俺はちゃんと記録しているんだ。
          なんて感じの粘着する人が増えて、
          いまの「リンクお断り」のように「HDDへの保存お断り」という問題フレーズを記載するサイトが増えそう。
          --
          It's not who is right, it's who is left.
          親コメント
    • SwiftProxy [vector.co.jp]ってソフトでそういうことができるんですが、公開停止がずっと続いてるんですよねぇ。
  • by Anonymous Coward on 2007年04月21日 0時24分 (#1145913)
    Google Toolbarが嫌いで入れていないので試していないのですが、ブラウザの履歴表示と何が違うんですか?

    Googleの検索結果も履歴では表示されますし…。

    複数PCにまたがっての履歴表示ってありがたいですか?
    • by firewheel (31280) on 2007年04月21日 9時35分 (#1146046)
      >Google Toolbarが嫌いで入れていないので試していないのですが、ブラウザの履歴表示と何が違うんですか?
      >Googleの検索結果も履歴では表示されますし…。
      まだ試せてないですが、おそらくは、既に指摘されている通り
      データがサーバー上に保持されることに加え、

      - 半永久的:ブラウザの検索履歴は通常は10~30日程度で、それを超える
      と消去されるよう設定されている。保持する期間を長く設定することは可能
      だが、長くすればするほど検索や表示にかかる時間も無視できなくなる。

      - 高度な検索:Googleの十八番の検索技術で、半永久的な履歴を瞬時に検索できる。

      ということではないかと。

      私がG-mailを使っている理由の一つは、検索能力だったりします。
      当然ですが検索に関してはBecky!よりも断然上です。
      親コメント
      • ・複数のブラウザで履歴を共有できる

        というのも大きいかもしれません。「デスクトップとノート」とか「IE と Firefox」とか「職場と自宅(オイ」で共有できれば、
        「以前見た記憶はあるけど、どれで見たのか覚えてない」と、途方にくれることが無くなります。

        #とはいえ、Googleにそういう情報は渡したくないので、私は使いません。PageRankもオフだし。
        #Google Desktop でローカルに検索できるようになるなら、使ってもイイかも…
        親コメント
      • by Anonymous Coward
        >高度な検索:Googleの十八番の検索技術で、半永久的な履歴を瞬時に検索できる。

        この「半永久的な履歴」には「キャッシュ」も含まれますか?
        昨日、半年前に検索したことのあるキーワードでググったら、もうほとんどヒットしなくなってた。
        一語なのに該当6件…半年前は100件近くあったのに。

        それも保存されるなら使う意味はあるかな。
        • Re:Ctrl+Hと違うの? (スコア:2, すばらしい洞察)

          by Anonymous Coward on 2007年04月22日 1時06分 (#1146389)
          別の枝でローカルとかSubversionとか吼えてる者です。

          >半年前に検索したことのあるキーワードでググったら、もうほとんどヒットしなくなってた。

          そうなんですよねえ。まさにそこなんですよ。
          時間軸に沿ってどう変化したかが追えて欲しいんですが、今(まで)そういうシステムが無いんで。

          >この「半永久的な履歴」には「キャッシュ」も含まれますか?

          Googleならやってくれかねん、とも思うんですが、
          一方で激しく無理も感じるんですよね。
          というのはGoogleが「世界中の」Webサイトを「今のみならず過去全部(原理的には)まで」押さえてるとすると、
          いったい世界のハードディスクの何割(^^;をGoogleが所有してんだ?という、
          幾ら大もうけしてる企業とはいえ無理の有りそうな話になってしまう。

          逆にいえば、全てを捉えるなんて無理だから、
          せめて自分でやったぶんは自分のHDDで記録する
          (幸い近年はそれに見合いそうなHDD量が自分の財布で期待できるわけだし)
          という発想に立ったのが、前述の私の「ローカル」って奴です。

          -----

          それとも今回のは、Googleが押さえた「全ての」履歴じゃなく、
          履歴とかのうち「ユーザに見られた」ぶんだけを選択的に残し、
          そうでない履歴は廃棄しちゃってHDDを浮かす
          っていう作戦なんでしょうかね?

          (つまり注目度が低くて&ある程度以上古い情報は、歯抜け的に忘れていくと。)

          そしてそのサービスを始めたとして食うであろうHDD量を試しに見積もってみたら
          GMailとかでみんなに提供してるHDD量と比べても
          現実的な値に収まりそうだ、ということなのかな?

          もしそうだとしたら、サービスの量(質)の割りには
          Googleにとって「お得」な面もありますね。
          というのは、個人のMailの保存とかじゃなく、Webキャッシュですから、
          複数の人が「同じ」キャッシュを参照していたら、
          それは内部的にディスクを1ファイルぶんしか食いませんから。
          親コメント
    • by Anonymous Coward on 2007年04月21日 1時24分 (#1145945)
      ブラウザの履歴表示と何が違うんですか?
      それはローカルコンピュータに情報を保存するんでしょ?

      で、今度のは、グーグルのサーバに情報を保存する。
      ツールバーを入れてると、ページをアクセスする毎に、URLをグーグルに送信してるわけ。

      親コメント
    • by Anonymous Coward
      使ってないので予想で書くけど、閲覧したページ内部コンテンツも対象に
      検索できるということなんじゃないのかな。ブラウザの履歴ってタイトルと
      URLくらいじゃないっけか。

      仕組みとしては検索した結果を閲覧履歴でフィルタするという感じ?
  • by Anonymous Coward on 2007年04月21日 0時30分 (#1145915)
    これ [beagle-project.org]じゃだめですか?(for beagle user)
    • by Anonymous Coward
      それは、未だ世界で8割以上のシェアを持つwwwブラウザで使えますか?
      • by Anonymous Coward
        大文字で書けよ。
        「何を笑っとるんだこのバカは」
        と思ってしまっただろ。
  • by Anonymous Coward on 2007年04月21日 0時32分 (#1145917)
    キモイサービスですね。

    だんだんGoogleが怖くなってきました。
    でも使いやすい検索サービスが他にあるのかどうか。
    Yahoo!検索も微妙な感じだし。
    • by Anonymous Coward on 2007年04月21日 0時48分 (#1145922)
      私はGoogleを検索エンジンとしてのみ使うためにいろいろ自衛手段を取っています。
      1. google.com, google.co.jp のクッキーはブラウザで常に拒否する。カスタマイズ機能は全て無視します
      2. GMailは利用しない。例外はROM専用のMLなど、メールの中身から自分のidentityが特定されないものに限る。それらも、ブラウザでなくメールソフトから利用
      3. その他、calendar, chatなど個人情報を含む情報を預けるサービスは利用しない
      4. Google Toolbarは絶対にインストールしない
      5. google-analytics.com, googlesyndication.comなどのtracking cookieをブロック。できればAdblockなどでサイトごとブロック

      要するに、彼らに包括的な情報を与えないことが大切。これでもIPアドレスからかなりの情報を取られてしまいますが。
      親コメント
      • by Anonymous Coward on 2007年04月21日 8時24分 (#1146034)
        私も漠然と「怖い・キモい」という感情を持っています。
        しかし、考えてみると、
        「個人を特定できる情報が他人に伝わること」=「悪」
        と思考が入らずに直結してしまっていて
        具体的にどういう事態を懸念しているのか、自分自身でもよく分かりません。

        例えば親記事の対策は大きく分けて以下の2種類の情報を
        Googleに知らせないようにするものだと思います。
        • 自分が発信したコンテンツ
        • 自分のWeb上での行動


        これで怖くなくなるのか?と考えると、以下の疑問がわいてきます。
        • コンテンツ自体なり通信路なりに見て欲しい相手のみが解読できる暗号を使わない限り、インターネットを使っている時点でコンテンツは第三者の目に触れて当たり前なのではなかったか? だから例えばメールで秘密情報を書かないというのは基本的なリテラシだったはず。
        • 行動が把握されて具体的に何が困るのだろうか? エロサイトを見ていたことが分かって恥ずかしい程度しか思いつかない。
        • Googleを使わなくてもメールや接続先の情報はもうISPに保存されている。これがGoogleにも保存されることで何か怖いことが増えるのだろうか?
        • Googleが包括的に情報を集めれば、個別の情報ソースだけを持っているより詳しく個人を特定できるかも知れない。でも詳しく特定されると何が困るのだろうか?


        というわけで、既にある怖さがやっぱりあるというだけで
        新しい怖さが発生するようには感じないのです。
        親コメント
        • by Anonymous Coward on 2007年04月22日 1時12分 (#1146393)
          情報を集約させないこと、がプライバシーを考える上での重要なポイントです。
          一つ一つの情報が公開情報であっても、それが無関係に分散して存在しているのと、名寄せされて特定のIDに結びつけられているのでは意味が全然違う。
          特にコンピューターの時代になって、一度蓄積された情報は二度と消えない。

          それから、「別に悪いことしてないんだから知られたって困らないでしょ?」というのは最も幼稚な議論です。「盗聴してもいいでしょ?」「身体検査してもいでしょ?」「家宅捜索してもいいでしょ?」というのと同じ理屈。

          まあこういうのは、プライバシーを気にしない人とは決して噛み合わない議論かも。
          親コメント
        • 漠然とした不安は「漠然とした不安」として正しいと思う。

          明らかにGoogleはすべての情報を集めコントロールできる立場を得つつある。仮にすべての情報に対する完全な(に近い)コントロールをGoogleが持ったとき、これだけでは漠然と気持ち悪くて不安なだけだけど、一転Googleが極悪になりその立場を最大限利用しようとしたら?そのとき人々は既に当たり前になってしまった代用のない便利さを捨てられるだろうか?それともGoogle様の顔色を伺いながら便利な世の中を受け入れるのだろうか?後者となるのではないかというのが、この漠然とした不安なのではないかと思っています。

          既にGoogleで検索対象にならないことはWebに存在しないことに等しい状況にまできています。そしてGoogle村八分という問題も起きている。Googleに対抗できる力が絶対に必要です。

          対抗できる力をみんなで育てましょう。金持っているところ。そうだマイクロソフトだ。みんなでマイクロソフトを応援しよう!(笑)
          --
          It's not who is right, it's who is left.
          親コメント
          • >そしてGoogle村八分という問題も起きている。Googleに対抗できる力が絶対に必要です。

            私のWebサイトはロボット回避をしているのでセルフGoogle八分ですね
            現実に例えると、山奥に一人で住んでいる変人でしょうか
        • >> 私も漠然と「怖い・キモい」という感情を持っています。

          そうそう,結局は漠然とした話なんだよね.

          amazonの「~さんにお勧めの商品があります」とかも,初めて見た瞬間は「うわっ,怖ぇ」と思ったし,今でも冷静に考えるとちょっと怖いけど,でもオレは便利さに負けて普通にamazonを使ってる.それと同じで,やっぱ「情報を渡す怖さ」と「情報を渡したことで得られる便利さ」のトレードオフってことでしょ.しかも,amazonにしても今回のgoogleのにしても,別「~のサービスを提供するから代償として個人情報を寄こせ」的な話というよりは,原理的にサーバ側に情報を保存することで初めて可能になるような話だしね.ま,不満があるなら使わなきゃ良いだけの話だし.

          ちなみにオレは「あれ?先週あたりに見つけた~の情報って,どんな検索で見つけたんだっけ?」的なことが稀にあるので,今回のサービスはちょっと良いかな,とは思う.
      • 【Tor】 [eff.org]

        # ちょっと重いらしいけど、使ってる人1人しか知らないので。
        親コメント
      • by Anonymous Coward on 2007年04月21日 13時30分 (#1146144)
        「これは怖い」と思う反面、たとえば携帯電話を持ってない人を見ると「何で持たないの!?」って言ってしまう自分に矛盾を感じる。
        親コメント
    • by Anonymous Coward
      是々非々でいきましょうよ。ToolbarとかBrowserSyncとかキモイ系からは逃げておく。検索時に履歴も残さないように、できるだけログオフしておく。
    • by Anonymous Coward
      とりえあえずPage Rankの表示機能は切りました。
      Page Rankの表示のために送信される情報が長期に渡り保存されるなんて気味悪くてしょうがない。

      CustomizeGoogleで送信する情報を制限してたんですけど心配になってきました。
    • by Anonymous Coward
      これは、自宅と、学校/会社で違うアカウントを使わないといけないサービスですね。
    • by Anonymous Coward

      僕はMooterが結構好きです。
      Googleと違う結果を渡してくれることが多いので、Googleと併用すると検索の効率が上がって助かっています。

      他にも僕はあまり使いませんがAAA! Cafeなどもいいと聞きます。
      多くの人が何となく習慣としてGoogleを使ってるだけで、ちょっと調べ物程度なら他の検索エンジンで代用可能であると考えています。もうちょっと詳しく調べ物という場合でもむしろGoogle一本での検索より他のエンジンと併用する方が効率が上がると思います。
      たとえるならば、家探しのために同じ条件でお願いしても不動産仲介屋ごとに色々な提案をしてくれるように、色々なところに聞いた方が多様な結果を得られて便利です。
      大手でここは外せない、というものとしてGoogleがあると思いますが、他のところと一緒に聞いてみるというのも一つの手です。

typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...