Internet Archive、保存されたWebページの異なるバージョンを比較する機能などを追加 17
ストーリー by headless
活用 部門より
活用 部門より
Internet Archiveは18日、Wayback Machineに保存された同じWebページの異なるバージョンを比較できる「Changes」機能など、複数の新機能追加を発表した(Internet Archive Blogsの記事、
BetaNewsの記事、
gHacksの記事)。
ベータ版として提供されているChanges機能では、表から2つのバージョンを選択して「Compare」をクリックすると変更部分にハイライトが入った2つのバージョンが並べて表示される。年ごとに分けられた表は行が月、列が日を示し、変更の度合いによってセルの色も変化する。同じくベータ版として提供されている「Collections」機能では、指定したページのスナップショットが保存理由別に一覧表示される。これらの機能はInternet Archiveに保存されたWebページの検索結果画面でカレンダーと切り替えて表示可能だ。
Webページによっては1日に非常に多数のスナップショットが保存されることもあるが、これまで検索結果のカレンダーでは一部しか選択できなかった。今回の更新により、保存時間の差が秒単位のものも含め、すべてのスナップショットが表示されるようになっている。また、ユーザーが指定したWebページのスナップショットを保存する「Save Page Now」機能では、最近の更新でリンク先ページの同時保存も可能になっている。
Internet Archiveによると、平均的なWebページは3か月以内に内容が変更されたり、削除されたりするという。Webページに掲載されていた情報にアクセスできなくなる「デジタル情報の絶滅」と戦うため、新たな手段をWayback Machineが提供するとのことだ。
ベータ版として提供されているChanges機能では、表から2つのバージョンを選択して「Compare」をクリックすると変更部分にハイライトが入った2つのバージョンが並べて表示される。年ごとに分けられた表は行が月、列が日を示し、変更の度合いによってセルの色も変化する。同じくベータ版として提供されている「Collections」機能では、指定したページのスナップショットが保存理由別に一覧表示される。これらの機能はInternet Archiveに保存されたWebページの検索結果画面でカレンダーと切り替えて表示可能だ。
Webページによっては1日に非常に多数のスナップショットが保存されることもあるが、これまで検索結果のカレンダーでは一部しか選択できなかった。今回の更新により、保存時間の差が秒単位のものも含め、すべてのスナップショットが表示されるようになっている。また、ユーザーが指定したWebページのスナップショットを保存する「Save Page Now」機能では、最近の更新でリンク先ページの同時保存も可能になっている。
Internet Archiveによると、平均的なWebページは3か月以内に内容が変更されたり、削除されたりするという。Webページに掲載されていた情報にアクセスできなくなる「デジタル情報の絶滅」と戦うため、新たな手段をWayback Machineが提供するとのことだ。
意外と残ってない (スコア:0)
機能強化よりもデータが残ってる事のほうが重要なんですが
※最初から記録されてなかったのかな…
Re: (スコア:0)
別に残らなくてもいいんじゃないんですかね。
残ってほしくない人もいるでしょうし。
全てのものは永遠じゃない。消えたら消えたで、仕方がないと諦めがつけられるという能力も人にとっては必要かと。
デジタルデータだって、電気がなきゃ意味のない程度のものですし。
Re: (スコア:0)
自分で保存しなさいよ
Re: (スコア:0)
Internet Archive のデータって,権利的に問題ないの?
お気にのサイトが消えちゃったから
同じように,自分で運営していいならしたい
Re: (スコア:0)
問題あるかどうかは別として、利用者からの保存依頼や収集済みサイトからのリンク先に対してロボットではじいてなければ取得する方針
一応「問題あったら消すから連絡してね」メールが収集対象ページ内にメールアドレスが書いてあれば来るようになっている
Re: (スコア:0)
オプトアウトとはいえ,一応,連絡はしているんですね
本当は,元サイトに確認できたら一番なんですけどね
ありがとうございます
Re: (スコア:0)
基本的には最初のスナップショットはユーザーからの保存依頼(URLいれてボタンを押す)という行為をしなければ保存されません。
(既に保存されているサイトからのリンクでも自動保存されるようになりますが、最近のWebサイト構造上、そっちで引っかかるのは稀です)
それ以降はクロールされるようになりますが、ロボット除けされているとそもそもボタン押しても保存されませんし、
クロールタイミングもサイトによってまちまちです。必要なら自分で保存しましょう。
Re: (スコア:0)
>それ以降はクロール
そういう機能はないです
Re: (スコア:0)
昔のWebページは、意外と残ってるけど、最近のWebページは意外と残ってないと感じる。
昔はWebページ自体すくなかったからかな、すごいマイナーなWebページなのに残ってたよ
Re:意外と残ってない (スコア:2)
素直な静的ページばかりだったからでは。
つくって一度サーバーにアップロードすれば、あとはほったらかしでよかったし、いっそ忘れてしまってもほとんど問題なかった。
最近(でもないけど)は、動的コンテンツがあたりまえで、レイアウトも凝ってる。
維持するなら保守みたいな作業が必要になりがちで、だったらいっそあきらめて削除のほうがラクだったり。
Save Now機能の改悪 (スコア:0)
1分に15回以上リクエスト出すなってエラーが出るようになってるけど、1つのページの画像やスクリプトファイル含めたら15回なんかあっという間だぞ
誰だよこの制限かけたIAのやつは
Re: (スコア:0)
300baudのカップラーで通信していればあまりエラーは出ないかも。
お世話になってます (スコア:0)
レトロゲーの攻略サイトなんて、その多くが消えてしまったので、
Internet Archiveがなければふと懐かしくなったときに見ることもできない。
ただURLを記録していない場合みつけられなくなるんだよなぁ…。
でもキーワード検索が最近だいぶ良くなってるみたい。
Re:お世話になってます (スコア:1)
ジオシティーズ終了の混乱の時に結構役だってましたね。
Re: (スコア:0)
裁判勝ちました【NHKの請求を裁判所が棄却】訴訟を著しく遅延させる行為と認定1
https://youtu.be/DcZGJZuHBas [youtu.be]
Re: (スコア:0)
この人の支持者ってマジやばいな
なんでこんなさっぱり関係ないとこに書き込むんや
当人の評価下げるだけやぞ
事前登録はできるのか (スコア:0)
削除が予想されるURLの事前登録は理解できるのか。事前登録でKeep。削除されたみたいならば使う