
インターネットアーカイブ、2億7900万ページのPDFファイルを検索できる機能を追加 4
ストーリー by nagazou
あんまり引っかからない感じ 部門より
あんまり引っかからない感じ 部門より
あるAnonymous Coward 曰く、
Internet Archiveのウェイバックマシンに「Collection Search」という機能が追加された。ウェイバックマシンのサイトから確認できる。今現在、PDFファイルのみが検索対象となっていて、適当な文字列を入れてみると、保存してある2億7900万ページのPDFファイルを検索できると書かれている。かつて全文検索があって廃止されたが、将来PDF以外のファイルにも対応するならば、実質全文検索の復活になるだろうか?
個人的には黒歴史を消したい人がこれを悪用して片っ端からページ表示凍結依頼出してくる可能性もあるので、出来れば全文検索のようなものは無い方がいいとは思うのだが。
検索履歴 (スコア:0)
個人的には黒歴史を消したい人がこれを悪用して片っ端からページ表示凍結依頼出してくる可能性もあるので、出来れば全文検索のようなものは無い方がいいとは思うのだが。
この対策として
削除依頼に紐づく関連情報をアーカイブし削除不可ってなるように仕組みを作ったら良さげ
削除依頼番号:*****
削除依頼者:***個人情報****
検索キーワード履歴
*****
*****
*****
*****
*****
# 削除による利益に対する代償も必要だよね
Re: (スコア:0)
ハンドルネームで運営していた厨ニの黒歴史のホームページを削除申請したら、管理人の個人名分かっちゃうからそういうの要らない
検索以前に (スコア:0)
欲しいページが消えてるからまったく利用しなくなった
2億7900万ページというのは何本のPDFなのかな (スコア:0)
2億7900万ページと言えば多そうに聞こえるけど、PDFはページ数が多くなりがちなので
PDFファイルの本数で言えば数十万本とか、その程度かもしれない。
適当にキーワード入れてもほとんどヒットせず、つまらないのは単にデータがほとんど取得できてないということかと。