アカウント名:
パスワード:
いったい10 ペタバイトのアーカイブの何%が実際に有用なデータなことか
ゴミクズを分別するとかいう発想自体が馬鹿の極み
今その時点・時代でのゴミデータはいらないと言うならそもそもこのアーカイブ行為が無駄だから。
五重塔の落書きとか当時からしたらゴミ、それどころか建設主からしたら犯罪的な行為でしょうけど、今その歴史的価値に関して、ゴミデータだっていう人居ないですよね?
遺跡の中からたった1つ掘り出されるから価値があるのであって、どこの庭でも1m掘り下げれば出てくるようなものなら誰も見向きもしないんじゃないですか。
どこの庭からでも出てくるものでも、時間の経過で失われるのであれば、それは未来において有用。人間の居住区域の何%分*時間経過の情報があるとしたらとても有用。
>誰も見向きもしないんじゃないですか。君の想像力、見識が足りないから意味を見いだせないだけ。
> どこの庭でも1m掘り下げれば出てくるようなものそうじゃないから、InternetArchiveが保存しようとしてるわけで。どのサーバーでも(サービス提供を終了したものも含む)将来にわたって過去のデータを閲覧できるような仕組みになっていればわざわざ保存しようとしないでしょう。
元コメでは「いずれ」とありますから、 現在がどうこうってことじゃないんじゃないすかね?(・_・ )
発掘作業というのはある種の破壊活動なのです。専門家がどれだけ丁寧にやっても決して発掘前の元の状態には戻らない。100年後の技術で発掘したら今の技術では判らないことが分かるかもしれない。そもそも、今の人間は調べなければならない事を理解していないかもしれません。
インターネットアーカイブはオリジナルが残っていれば何度でも発掘可能な素晴らしい史料です。どのように発掘するかは後世の研究家に任せるべきです。研究目的も持たない我々がオリジナルを「綺麗にしたいから」といった理由で手を加えていいものではありません。
浮世絵は船便の梱包材として使われて、西洋に伝わったという例もありますね。
千年前の落書きに「ゴミクズを分別するとかいう発想自体が馬鹿の極み」なんて書かれていたらとても興味深いと思わないか。
データに対してわざわざ「文化的に無価値かどうか」判定をする位なら全部保存した方が良いでしょう。あと、スパムだろうがマルウェアだろうがそこに文化的価値が全く無いとは思えないし、データの蓄積にあたって重複排除位は当然しているだろう。
つまりウンコも瓶詰めして保存したほうがいいということだな。
保存コストとのご相談だけれどね。
将来、そういったスパムの量の分析などに価値を見出すかもしれないじゃないですか。
#Internet Archiveにはスパムメールは収集されていないと思いますが
洞窟の壁に落書きした人も数千年後に貴重がられるとは思わなかったでしょうね。
江戸時代の町人の日記とか。当時はどこにでもあるただの日常を記しただけの雑記だけど、数百年後の今となっては貴重な歴史的/文化的な資料だしね。武士が記した家計簿とか宴会の献立とかもあるんだっけか。
残せるうちはなんでも残せばいいんだよ。重複しててもいいじゃない。ないよりはある方がいいに決まってる。後の世に、重複してることに資料的意味を見出す人が出てくるかもしれないし。
文化は高尚なモノではないのですよ。
ゴミが多いことに関しては同意なのですが、他者の意図の入ってない生のデーターですよ。分類や分別が大変でも、それは後の時代の研究者の研究目的に沿ったものでなければならない訳です。
1000年前のインタネットに流れているトラフィックの90パーセントはスパムやマルウェアでしたという史実が分かるんだからそれでいいのでは?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲを呼ぶ -- ある傍観者
いずれゴミクズデータを破棄する専門業者が必要そう (スコア:0)
いったい10 ペタバイトのアーカイブの何%が実際に有用なデータなことか
1000年経てば落書きも文化財 (スコア:1, すばらしい洞察)
ゴミクズを分別するとかいう発想自体が馬鹿の極み
Re: (スコア:0)
Re:1000年経てば落書きも文化財 (スコア:1)
今その時点・時代でのゴミデータはいらないと言うならそもそもこのアーカイブ行為が無駄だから。
五重塔の落書きとか当時からしたらゴミ、それどころか建設主からしたら犯罪的な行為でしょうけど、
今その歴史的価値に関して、ゴミデータだっていう人居ないですよね?
Re: (スコア:0)
遺跡の中からたった1つ掘り出されるから価値があるのであって、どこの庭でも1m掘り下げれば出てくるようなものなら
誰も見向きもしないんじゃないですか。
Re:1000年経てば落書きも文化財 (スコア:1)
どこの庭からでも出てくるものでも、
時間の経過で失われるのであれば、それは未来において有用。
人間の居住区域の何%分*時間経過の情報があるとしたらとても有用。
>誰も見向きもしないんじゃないですか。
君の想像力、見識が足りないから意味を見いだせないだけ。
Re: (スコア:0)
> どこの庭でも1m掘り下げれば出てくるようなもの
そうじゃないから、InternetArchiveが保存しようとしてるわけで。
どのサーバーでも(サービス提供を終了したものも含む)将来にわたって過去のデータを閲覧できるような仕組みになっていればわざわざ保存しようとしないでしょう。
Re: (スコア:0)
Re: (スコア:0)
元コメでは「いずれ」とありますから、 現在がどうこうってことじゃないんじゃないすかね?(・_・ )
Re: (スコア:0)
発掘作業というのはある種の破壊活動なのです。
専門家がどれだけ丁寧にやっても決して発掘前の元の状態には戻らない。
100年後の技術で発掘したら今の技術では判らないことが分かるかもしれない。
そもそも、今の人間は調べなければならない事を理解していないかもしれません。
インターネットアーカイブはオリジナルが残っていれば何度でも発掘可能な素晴らしい史料です。
どのように発掘するかは後世の研究家に任せるべきです。
研究目的も持たない我々がオリジナルを「綺麗にしたいから」といった理由で手を加えていいものではありません。
Re: (スコア:0)
浮世絵は船便の梱包材として使われて、西洋に伝わったという例もありますね。
Re:1000年経てば落書きも文化財 (スコア:2, すばらしい洞察)
千年前の落書きに「ゴミクズを分別するとかいう発想自体が馬鹿の極み」なんて書かれていたらとても興味深いと思わないか。
データに対してわざわざ「文化的に無価値かどうか」判定をする位なら全部保存した方が良いでしょう。
あと、スパムだろうがマルウェアだろうがそこに文化的価値が全く無いとは思えないし、
データの蓄積にあたって重複排除位は当然しているだろう。
Re: (スコア:0)
つまりウンコも瓶詰めして保存したほうがいいということだな。
Re: (スコア:0)
保存コストとのご相談だけれどね。
Re: (スコア:0)
5300年前のアイスマン、腸の残留物から生活の様子が判明 [wired.jp]
Re:1000年経てば落書きも文化財 (スコア:2)
解析技術もどんどん向上していきますし。順調に進めば、それこそ、ふとした暇つぶしに「ご先祖様の発言と思われる奴を全部リストアップして時代毎にサマリーを作成」などと高機能なデータマイニングAIに命じてみる、ぐらいできるようになるでしょうし。
Re:1000年経てば落書きも文化財 (スコア:1)
将来、そういったスパムの量の分析などに価値を見出すかもしれないじゃないですか。
#Internet Archiveにはスパムメールは収集されていないと思いますが
Re: (スコア:0)
洞窟の壁に落書きした人も数千年後に貴重がられるとは思わなかったでしょうね。
Re:1000年経てば落書きも文化財 (スコア:1)
江戸時代の町人の日記とか。当時はどこにでもあるただの日常を記しただけの雑記だけど、
数百年後の今となっては貴重な歴史的/文化的な資料だしね。
武士が記した家計簿とか宴会の献立とかもあるんだっけか。
残せるうちはなんでも残せばいいんだよ。
重複しててもいいじゃない。ないよりはある方がいいに決まってる。
後の世に、重複してることに資料的意味を見出す人が出てくるかもしれないし。
Re: (スコア:0)
文化は高尚なモノではないのですよ。
ゴミが多いことに関しては同意なのですが、他者の意図の入ってない生のデーターですよ。
分類や分別が大変でも、それは後の時代の研究者の研究目的に沿ったものでなければならない訳です。
Re: (スコア:0)
1000年前のインタネットに流れているトラフィックの90パーセントはスパムやマルウェアでしたという史実が分かるんだからそれでいいのでは?