Google、閲覧履歴を記録・検索するWeb Historyを開始 39
ストーリー by yoosee
ある意味、究極のプライバシー 部門より
ある意味、究極のプライバシー 部門より
Anonymous Coward 曰く、
Google 公式ブログの記事 Your slice of the web にて Web History というサービスを開始したことがアナウンスされている。 Search History を改良したもののようで、使うには Googleアカウント、及び Page Rank を有効にした Google Toolbar が必要。
使ってみると分かるが、検索を含めて過去の自分がどんな行動を取っているのか丸分かりで、 これを見るとさすがに引いてしまう。Googleは怖いですね。
名前の通り、Web 閲覧の History (履歴) を記録して後から検索可能にするサービス。「あれ、あの情報はどこで見たっけ?」と言ったときに、自分の閲覧履歴を対象として検索することが出来る。先行して提供されていた検索履歴の検索機能 Search History はこれに統合される形になるようだ。
まぁまぁ、FAQ でも。 (スコア:3, 興味深い)
まぁまぁ、そう言いたくなる気持ちはわかりますが、FAQ [google.com]を読むとさすがにその辺が気になる人が多いのはわかっているようで。
Q.2: どうやったら Web History からアイテムを消せるの?
Q.4: どこにデータは保存されるの?
A.4: Google のサーバです(以下略)
Q.5: サインアップしてないのでなんで Web History が使えるの?
A.5: Google Account にサインアップすると自動的に Web History を含むサービスが使えるようになります(略)
Q.7: 他の人が自分の Web History を見れるのか?
A.7: Google Account の ID さえあれば(意訳)。
Q.5は注意かな。すでに Google Account を持っている場合には、勝手に追加されることはないようです。
Re:まぁまぁ、FAQ でも。 (スコア:0)
これに対応する A.2 がない。やっぱりキモい・怖い。
# 単なる茶々なので AC
Re:まぁまぁ、FAQ でも。 (スコア:0)
FAQに書いてある方法で操作してもユーザー(自分)から見えなくなるだけで、Googleのデータベースから消去される保証はないし、実際のところ消去されないでしょう。
Re:まぁまぁ、FAQ でも。 (スコア:0)
意訳になってないよ。
自分のユーザー名とパスワードを他人と共有した場合。ここ抜けたら駄目でしょ・・・。
Re:まぁまぁ、FAQ でも。 (スコア:1)
ローカルじゃ駄目なの? (スコア:2, 興味深い)
それこそGoogleや第三者に見られるかも知れなくて怖いっていう点と、あと近年のHDDの巨大化(安価化)の恩恵を考えると、ローカルでやっちゃえばいいんじゃないの?と思うんですが。
私がよく思うのは、
●自分のパソコン(数台で共用してもいいが)で
●閲覧したWebサイトを
●URLおよび時刻ごとに
●全部記録しておいて(つまり同URLなら「バージョン管理」をすることになる)
●あとからURLと時刻を指定すれば
●それを読み出せる
っていうソフトです。
以前はWebキャッシュソフトのキャッシュ保持時間を無限大に設定して
●URLごとに全部記録
っていうのを使っていたんですが、これだと刻々更新されるサイトを閲覧すると過去の情報を上書き消去してしまうのであまり役立たないってのと、あと数年前だったのでHDDがたちどころに一杯になってしまった(^^;ってのがあって、やめてしまいました。
素朴に考えれば自分のパソコン(自宅LANの中のパソコンのどれかでも可)にそういうプロキシソフトを立てればいいだろうなと思っています。
クイックハックで作ってみたいなあと思っています。
原理的にはおそらく簡単で
●Webアクセスされるたびに、URLに一対一対応したファイルを(HDDに)保存
●保存したファイルをSubversionか何かにチェックイン
●チェックインした奴を閲覧するための別の口も用意しておく
で出来ると思うんですが、難点がひとつあって、
●ファイル名として受け付けてもらえないくらい馬鹿長いURL
をどう処理するか?のいいアイデアがまだ無い状態です。
どなたか、
「ファイル(名)を経由せずにチェックイン/アウトできるバージョン管理ツール」
が有ったら教えてください。
名前(のような属性)は好きなだけ長く複雑なものをつけてもいいってことにして、
あとファイル内容のような実データはストリームなどで直接やりとりってことで。
Re:ローカルじゃ駄目なの? (スコア:1)
Windows だったら Unicode 版 API を使っていればファイル名は MAX_PATH の制限から約 32,000 文字まで増えますので、大抵は URL そのままでも入るのではないでしょうか。
ANSI 版 API を使ってるアプリとかだとアウトですが。
Re:ローカルじゃ駄目なの? (スコア:0)
まあそうすると単なるバージョン管理ソフトだけでは実現できないかもしれないけど。
Re:ローカルじゃ駄目なの? (スコア:0)
やっぱりその辺になりますかね。
リアルなURLでファイルを探すのが難渋しそうですが、
考えたら探すときも同じハッシュ式で変換かけて探せばいいか。
(あいまい検索が心配だが)
あとURLそのものの記録は、たとえばSubversionだと
「属性」を食わせればいいかな。
1つのフォルダにファイルを大量に放り込むと遅くなったりするから、
128バイトを数段に区切ってフォルダ階層を作ればいいですね。
まあそういう風に妥協すれば
何とかなりそうですね。作ってみよっかな。
>バージョン管理ソ
Re:ローカルじゃ駄目なの? (スコア:0)
Re:ローカルじゃ駄目なの? (スコア:0)
全文検索も欲しいですが、一方で過去情報の保持も欲しいと思っています。前述したように上書きされると(私としては)価値が半減なので。過去保持を実現してる「話」は、たとえばどんなのが有るでしょう?あまり見かけない気がするのですが。
なお、もちろん両方あわせて「過去」の「検索」が出来るのが理想です。そういえばCVSやSubversionで記録した過去バージョンの検索ってのはあまり聞きませんね。CVSWebとかでWeb化したうえでWeb検索エンジンにかけるっていう二度手間なら見かけますが、それだと(今回の話から離れますが)ローカルで開発してるときに鬱陶しい。そもそもプログラマのみなさんは「xxxって単語を消したのはいつだったかな」って調べるときどうしてるんでしょうか?そのためだけにWebサーバを立てたり?
これがPlan9だとリポジトリもディレクトリツリーとして見せてくれるのかな。だとすれば普通のgrepだろうがなんだろうが使い放題なわけですが。
Re:ローカルじゃ駄目なの? (スコア:1)
お前は何月何日~何月何日の間に×××という修正を加えた。俺はちゃんと記録しているんだ。
なんて感じの粘着する人が増えて、
いまの「リンクお断り」のように「HDDへの保存お断り」という問題フレーズを記載するサイトが増えそう。
It's not who is right, it's who is left.
Re:ローカルじゃ駄目なの? (スコア:0)
Ctrl+Hと違うの? (スコア:0)
Googleの検索結果も履歴では表示されますし…。
複数PCにまたがっての履歴表示ってありがたいですか?
Re:Ctrl+Hと違うの? (スコア:4, 参考になる)
>Googleの検索結果も履歴では表示されますし…。
まだ試せてないですが、おそらくは、既に指摘されている通り
データがサーバー上に保持されることに加え、
- 半永久的:ブラウザの検索履歴は通常は10~30日程度で、それを超える
と消去されるよう設定されている。保持する期間を長く設定することは可能
だが、長くすればするほど検索や表示にかかる時間も無視できなくなる。
- 高度な検索:Googleの十八番の検索技術で、半永久的な履歴を瞬時に検索できる。
ということではないかと。
私がG-mailを使っている理由の一つは、検索能力だったりします。
当然ですが検索に関してはBecky!よりも断然上です。
Re:Ctrl+Hと違うの? (スコア:1)
というのも大きいかもしれません。「デスクトップとノート」とか「IE と Firefox」とか「職場と自宅(オイ」で共有できれば、
「以前見た記憶はあるけど、どれで見たのか覚えてない」と、途方にくれることが無くなります。
#とはいえ、Googleにそういう情報は渡したくないので、私は使いません。PageRankもオフだし。
#Google Desktop でローカルに検索できるようになるなら、使ってもイイかも…
Re:Ctrl+Hと違うの? (スコア:0)
この「半永久的な履歴」には「キャッシュ」も含まれますか?
昨日、半年前に検索したことのあるキーワードでググったら、もうほとんどヒットしなくなってた。
一語なのに該当6件…半年前は100件近くあったのに。
それも保存されるなら使う意味はあるかな。
Re:Ctrl+Hと違うの? (スコア:2, すばらしい洞察)
>半年前に検索したことのあるキーワードでググったら、もうほとんどヒットしなくなってた。
そうなんですよねえ。まさにそこなんですよ。
時間軸に沿ってどう変化したかが追えて欲しいんですが、今(まで)そういうシステムが無いんで。
>この「半永久的な履歴」には「キャッシュ」も含まれますか?
Googleならやってくれかねん、とも思うんですが、
一方で激しく無理も感じるんですよね。
というのはGoogleが「世界中の」Webサイトを「今のみならず過去全部(原理的には)まで」押さえてるとすると、
いったい世界のハードディスクの何割(^^;をGoogleが所有してんだ?という、
幾ら大もうけしてる企業とはいえ無理の有りそうな話になってしまう。
逆にいえば、全てを捉えるなんて無理だから、
せめて自分でやったぶんは自分のHDDで記録する
(幸い近年はそれに見合いそうなHDD量が自分の財布で期待できるわけだし)
という発想に立ったのが、前述の私の「ローカル」って奴です。
-----
それとも今回のは、Googleが押さえた「全ての」履歴じゃなく、
履歴とかのうち「ユーザに見られた」ぶんだけを選択的に残し、
そうでない履歴は廃棄しちゃってHDDを浮かす
っていう作戦なんでしょうかね?
(つまり注目度が低くて&ある程度以上古い情報は、歯抜け的に忘れていくと。)
そしてそのサービスを始めたとして食うであろうHDD量を試しに見積もってみたら
GMailとかでみんなに提供してるHDD量と比べても
現実的な値に収まりそうだ、ということなのかな?
もしそうだとしたら、サービスの量(質)の割りには
Googleにとって「お得」な面もありますね。
というのは、個人のMailの保存とかじゃなく、Webキャッシュですから、
複数の人が「同じ」キャッシュを参照していたら、
それは内部的にディスクを1ファイルぶんしか食いませんから。
Re:Ctrl+Hと違うの? (スコア:1, 参考になる)
で、今度のは、グーグルのサーバに情報を保存する。
ツールバーを入れてると、ページをアクセスする毎に、URLをグーグルに送信してるわけ。
Re:Ctrl+Hと違うの? (スコア:0)
検索できるということなんじゃないのかな。ブラウザの履歴ってタイトルと
URLくらいじゃないっけか。
仕組みとしては検索した結果を閲覧履歴でフィルタするという感じ?
代替案 (スコア:0)
Re:代替案 (スコア:0)
Re:代替案 (スコア:0)
「何を笑っとるんだこのバカは」
と思ってしまっただろ。
さすがにこれは (スコア:0)
だんだんGoogleが怖くなってきました。
でも使いやすい検索サービスが他にあるのかどうか。
Yahoo!検索も微妙な感じだし。
Re:さすがにこれは (スコア:2, 参考になる)
要するに、彼らに包括的な情報を与えないことが大切。これでもIPアドレスからかなりの情報を取られてしまいますが。
我々は何が怖いのだろう (スコア:3, 興味深い)
しかし、考えてみると、
「個人を特定できる情報が他人に伝わること」=「悪」
と思考が入らずに直結してしまっていて
具体的にどういう事態を懸念しているのか、自分自身でもよく分かりません。
例えば親記事の対策は大きく分けて以下の2種類の情報を
Googleに知らせないようにするものだと思います。
これで怖くなくなるのか?と考えると、以下の疑問がわいてきます。
というわけで、既にある怖さがやっぱりあるというだけで
新しい怖さが発生するようには感じないのです。
Re:我々は何が怖いのだろう (スコア:1, すばらしい洞察)
一つ一つの情報が公開情報であっても、それが無関係に分散して存在しているのと、名寄せされて特定のIDに結びつけられているのでは意味が全然違う。
特にコンピューターの時代になって、一度蓄積された情報は二度と消えない。
それから、「別に悪いことしてないんだから知られたって困らないでしょ?」というのは最も幼稚な議論です。「盗聴してもいいでしょ?」「身体検査してもいでしょ?」「家宅捜索してもいいでしょ?」というのと同じ理屈。
まあこういうのは、プライバシーを気にしない人とは決して噛み合わない議論かも。
Re:我々は何が怖いのだろう (スコア:1)
明らかにGoogleはすべての情報を集めコントロールできる立場を得つつある。仮にすべての情報に対する完全な(に近い)コントロールをGoogleが持ったとき、これだけでは漠然と気持ち悪くて不安なだけだけど、一転Googleが極悪になりその立場を最大限利用しようとしたら?そのとき人々は既に当たり前になってしまった代用のない便利さを捨てられるだろうか?それともGoogle様の顔色を伺いながら便利な世の中を受け入れるのだろうか?後者となるのではないかというのが、この漠然とした不安なのではないかと思っています。
既にGoogleで検索対象にならないことはWebに存在しないことに等しい状況にまできています。そしてGoogle村八分という問題も起きている。Googleに対抗できる力が絶対に必要です。
対抗できる力をみんなで育てましょう。金持っているところ。そうだマイクロソフトだ。みんなでマイクロソフトを応援しよう!(笑)
It's not who is right, it's who is left.
Re:我々は何が怖いのだろう (スコア:0)
私のWebサイトはロボット回避をしているのでセルフGoogle八分ですね
現実に例えると、山奥に一人で住んでいる変人でしょうか
Re:我々は何が怖いのだろう (スコア:0)
そうそう,結局は漠然とした話なんだよね.
amazonの「~さんにお勧めの商品があります」とかも,初めて見た瞬間は「うわっ,怖ぇ」と思ったし,今でも冷静に考えるとちょっと怖いけど,でもオレは便利さに負けて普通にamazonを使ってる.それと同じで,やっぱ「情報を渡す怖さ」と「情報を渡したことで得られる便利さ」のトレードオフってことでしょ.しかも,amazonにしても今回のgoogleのにしても,別「~のサービスを提供するから代償として個人情報を寄こせ」的な話というよりは,原理的にサーバ側に情報を保存することで初めて可能になるような話だしね.ま,不満があるなら使わなきゃ良いだけの話だし.
ちなみにオレは「あれ?先週あたりに見つけた~の情報って,どんな検索で見つけたんだっけ?」的なことが稀にあるので,今回のサービスはちょっと良いかな,とは思う.
Re:さすがにこれは (スコア:1)
# ちょっと重いらしいけど、使ってる人1人しか知らないので。
Re:さすがにこれは (スコア:1)
Googleのようにクッキーやツールバーやgmailアカウントを元にトラッキングしているケースではあまり意味は無いですよね。
Re:さすがにこれは (スコア:1)
# 自分はそんな面倒くさい事やりませんけどw
Re:さすがにこれは (スコア:1, 興味深い)
Re:さすがにこれは (スコア:0)
Re:さすがにこれは (スコア:0)
Page Rankの表示のために送信される情報が長期に渡り保存されるなんて気味悪くてしょうがない。
CustomizeGoogleで送信する情報を制限してたんですけど心配になってきました。
Re:さすがにこれは (スコア:0)
Re:さすがにこれは (スコア:0)
僕はMooterが結構好きです。
Googleと違う結果を渡してくれることが多いので、Googleと併用すると検索の効率が上がって助かっています。
他にも僕はあまり使いませんがAAA! Cafeなどもいいと聞きます。
多くの人が何となく習慣としてGoogleを使ってるだけで、ちょっと調べ物程度なら他の検索エンジンで代用可能であると考えています。もうちょっと詳しく調べ物という場合でもむしろGoogle一本での検索より他のエンジンと併用する方が効率が上がると思います。
たとえるならば、家探しのために同じ条件でお願いしても不動産仲介屋ごとに色々な提案をしてくれるように、色々なところに聞いた方が多様な結果を得られて便利です。
大手でここは外せない、というものとしてGoogleがあると思いますが、他のところと一緒に聞いてみるというのも一つの手です。