アカウント名:
パスワード:
いったい10 ペタバイトのアーカイブの何%が実際に有用なデータなことか
ゴミクズを分別するとかいう発想自体が馬鹿の極み
というあなたのコメントに例えば文化的価値があるとも思えないですけど。インタネットに流れているトラフィックの90パーセントはスパムやマルウェアだということを忘れていませんか。それにサムネイルなど重複したコンテンツかどうかの検証もせずにただ貯めこむんですか?それこそ愚の骨頂と言えると思いますが。
千年前の落書きに「ゴミクズを分別するとかいう発想自体が馬鹿の極み」なんて書かれていたらとても興味深いと思わないか。
データに対してわざわざ「文化的に無価値かどうか」判定をする位なら全部保存した方が良いでしょう。あと、スパムだろうがマルウェアだろうがそこに文化的価値が全く無いとは思えないし、データの蓄積にあたって重複排除位は当然しているだろう。
つまりウンコも瓶詰めして保存したほうがいいということだな。
保存コストとのご相談だけれどね。
将来、そういったスパムの量の分析などに価値を見出すかもしれないじゃないですか。
#Internet Archiveにはスパムメールは収集されていないと思いますが
洞窟の壁に落書きした人も数千年後に貴重がられるとは思わなかったでしょうね。
江戸時代の町人の日記とか。当時はどこにでもあるただの日常を記しただけの雑記だけど、数百年後の今となっては貴重な歴史的/文化的な資料だしね。武士が記した家計簿とか宴会の献立とかもあるんだっけか。
残せるうちはなんでも残せばいいんだよ。重複しててもいいじゃない。ないよりはある方がいいに決まってる。後の世に、重複してることに資料的意味を見出す人が出てくるかもしれないし。
文化は高尚なモノではないのですよ。
ゴミが多いことに関しては同意なのですが、他者の意図の入ってない生のデーターですよ。分類や分別が大変でも、それは後の時代の研究者の研究目的に沿ったものでなければならない訳です。
1000年前のインタネットに流れているトラフィックの90パーセントはスパムやマルウェアでしたという史実が分かるんだからそれでいいのでは?
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
※ただしPHPを除く -- あるAdmin
いずれゴミクズデータを破棄する専門業者が必要そう (スコア:0)
いったい10 ペタバイトのアーカイブの何%が実際に有用なデータなことか
1000年経てば落書きも文化財 (スコア:1, すばらしい洞察)
ゴミクズを分別するとかいう発想自体が馬鹿の極み
Re:1000年経てば落書きも文化財 (スコア:-1)
というあなたのコメントに例えば文化的価値があるとも思えないですけど。
インタネットに流れているトラフィックの90パーセントはスパムやマルウェアだということを忘れていませんか。
それにサムネイルなど重複したコンテンツかどうかの検証もせずにただ貯めこむんですか?
それこそ愚の骨頂と言えると思いますが。
Re:1000年経てば落書きも文化財 (スコア:2, すばらしい洞察)
千年前の落書きに「ゴミクズを分別するとかいう発想自体が馬鹿の極み」なんて書かれていたらとても興味深いと思わないか。
データに対してわざわざ「文化的に無価値かどうか」判定をする位なら全部保存した方が良いでしょう。
あと、スパムだろうがマルウェアだろうがそこに文化的価値が全く無いとは思えないし、
データの蓄積にあたって重複排除位は当然しているだろう。
Re: (スコア:0)
つまりウンコも瓶詰めして保存したほうがいいということだな。
Re: (スコア:0)
保存コストとのご相談だけれどね。
Re: (スコア:0)
5300年前のアイスマン、腸の残留物から生活の様子が判明 [wired.jp]
Re:1000年経てば落書きも文化財 (スコア:2)
解析技術もどんどん向上していきますし。順調に進めば、それこそ、ふとした暇つぶしに「ご先祖様の発言と思われる奴を全部リストアップして時代毎にサマリーを作成」などと高機能なデータマイニングAIに命じてみる、ぐらいできるようになるでしょうし。
Re:1000年経てば落書きも文化財 (スコア:1)
将来、そういったスパムの量の分析などに価値を見出すかもしれないじゃないですか。
#Internet Archiveにはスパムメールは収集されていないと思いますが
Re: (スコア:0)
洞窟の壁に落書きした人も数千年後に貴重がられるとは思わなかったでしょうね。
Re:1000年経てば落書きも文化財 (スコア:1)
江戸時代の町人の日記とか。当時はどこにでもあるただの日常を記しただけの雑記だけど、
数百年後の今となっては貴重な歴史的/文化的な資料だしね。
武士が記した家計簿とか宴会の献立とかもあるんだっけか。
残せるうちはなんでも残せばいいんだよ。
重複しててもいいじゃない。ないよりはある方がいいに決まってる。
後の世に、重複してることに資料的意味を見出す人が出てくるかもしれないし。
Re: (スコア:0)
文化は高尚なモノではないのですよ。
ゴミが多いことに関しては同意なのですが、他者の意図の入ってない生のデーターですよ。
分類や分別が大変でも、それは後の時代の研究者の研究目的に沿ったものでなければならない訳です。
Re: (スコア:0)
1000年前のインタネットに流れているトラフィックの90パーセントはスパムやマルウェアでしたという史実が分かるんだからそれでいいのでは?