パスワードを忘れた? アカウント作成
15517118 story
インターネット

インターネットアーカイブ、2億7900万ページのPDFファイルを検索できる機能を追加 4

ストーリー by nagazou
あんまり引っかからない感じ 部門より
あるAnonymous Coward 曰く、

Internet Archiveのウェイバックマシンに「Collection Search」という機能が追加された。ウェイバックマシンのサイトから確認できる。今現在、PDFファイルのみが検索対象となっていて、適当な文字列を入れてみると、保存してある2億7900万ページのPDFファイルを検索できると書かれている。かつて全文検索があって廃止されたが、将来PDF以外のファイルにも対応するならば、実質全文検索の復活になるだろうか?

個人的には黒歴史を消したい人がこれを悪用して片っ端からページ表示凍結依頼出してくる可能性もあるので、出来れば全文検索のようなものは無い方がいいとは思うのだが。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2021年12月17日 18時12分 (#4171906)

    個人的には黒歴史を消したい人がこれを悪用して片っ端からページ表示凍結依頼出してくる可能性もあるので、出来れば全文検索のようなものは無い方がいいとは思うのだが。

    この対策として
    削除依頼に紐づく関連情報をアーカイブし削除不可ってなるように仕組みを作ったら良さげ

    削除依頼番号:*****
    削除依頼者:***個人情報****
    検索キーワード履歴
    *****
    *****
    *****
    *****
    *****

    # 削除による利益に対する代償も必要だよね

    • by Anonymous Coward

      ハンドルネームで運営していた厨ニの黒歴史のホームページを削除申請したら、管理人の個人名分かっちゃうからそういうの要らない

  • by Anonymous Coward on 2021年12月17日 18時47分 (#4171926)

    欲しいページが消えてるからまったく利用しなくなった

  • by Anonymous Coward on 2021年12月19日 16時43分 (#4172646)

    2億7900万ページと言えば多そうに聞こえるけど、PDFはページ数が多くなりがちなので
    PDFファイルの本数で言えば数十万本とか、その程度かもしれない。
    適当にキーワード入れてもほとんどヒットせず、つまらないのは単にデータがほとんど取得できてないということかと。

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...