パスワードを忘れた? アカウント作成
6521724 story
インターネット

Internet Archive、アーカイブ量が 10 ペタバイトを超える 70

ストーリー by reo
10ぺたーん 部門より

ある Anonymous Coward 曰く、

ネット上のコンテンツをアーカイブしている Internet Archive において、アーカイブしているデータ量が 10 ペタバイト (10,000,000,000,000,000バイト) を超えたという (Internet Archive Blogs の記事より)。

1 TB の HDD 1 万本分と考えると多いのか少ないのかちょっと分からなくなるが、この量のストレージをメンテナンスしていくのは大変そうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2012年10月30日 11時02分 (#2262116)

    こんな感じのデータを出して欲しいなあ。

    Googleが大量に使用しているHDDの故障率の分析
    http://srad.jp/story/07/02/18/2229247/Google%E3%81%8C%E5%A4%A7%E9%87%8... [srad.jp]

    • by Anonymous Coward

      故障で失われたデータがあるのかどうかも気になるところ

  • by Anonymous Coward on 2012年10月30日 13時57分 (#2262316)

    えんえんと、πとかeとか載っているサイトって
    月替わり、今月の超越数!とか。
    #何が言いたい

  • いったい10 ペタバイトのアーカイブの何%が実際に有用なデータなことか

    • by Anonymous Coward on 2012年10月30日 11時32分 (#2262140)

      テレビ番組の受け売りですが、東京国立近代美術館フィルムセンターの方が「重みづけをせず収集することに意義がある。
      後世で重要となるフィルムを収集しそこなうことがあってはならない。」といったことを仰っていました。

      親コメント
      • by Anonymous Coward

        http://extreme-social-media.com/ [extreme-social-media.com]

    • 細かい利用法は後世の人に任すとして、とりあえず「系まるごと」として保存しましょってことなんじゃないの? よく知らないけど。
      そこで個々のデータの価値がーーとか気にし出しちゃうと、それこそとてつもなく重要な何かが失われてしまう気がする。よくわかんないけど。

      親コメント
      • by Anonymous Coward

        まともな研究者ならそれがいかに馬鹿げていることかってのがわかるはずですけど。
        たとえば現代人の文化の研究のためとかいって渋谷や新宿の駅前に24時間カメラとマイクを立てて毎日サンプリングした何十年分にも及ぶ映像をそのままアーカイブして後世の役に立つ、なんて真顔で言う研究者なんていませんよ。それがいかに馬鹿げたことかを知っているからです。

        • うーーんそんなん言われたら話が終わってしまう…。
          まあ続けるおつもりもないのかもしれないけど、せめてどう馬鹿げているのかとか、インターネットアーカイブはどう変わるべきなのかとか、ヒントでもお聞かせ願えれば。

          親コメント
        • いないのか?いるけれど、プライバシー面で難しいからやってないだけかと思っていた。

          例えば「江戸の城下町の賑わう一角にて、そこで聞こえてきた言葉を何十年もの間ひたすら記してきた紙束」
          なんてものが今見つかったら、当時の風土の研究には大いに役立つとは思うけれどね。

          親コメント
        • 後世の歴史研究家にはものすごく役に立つんじゃね?
          まともな研究者なら、馬鹿げてるどころか望むところだと思うがね。
          権利の問題とかプライバシーとかの意味で馬鹿げている、という研究者ならいるかもしれないが。

          そもそもにして、何をもって役に立つのか定義しないことには話にならない。
          個人レベルで見れば、全体の50%以上は役に立つ情報だと思うしな。
          大抵の情報は、世界の誰かしらには役に立つだろうから。
          自分主観や狭い視点でしか見れなければ、殆どが無駄と考えてしまうんだろうけど。

          自分自身にとって役に立つ、という意味でなら
          1%どころか0.0001%もあるかどうか怪しいだろう。
          しかし世界全体、更には現在だけではなく何百年何万年先の未来も含め、ついには外宇宙生命体が干渉してくる可能性すら考慮すれば
          それこそ逆に無駄な情報の方が少ないのではないだろうか。
          何百年先にデータが残ってないなんて言わないように。
          消える前にバックアップを繰り返して残していくかもしれないしな。

          親コメント
        • by Anonymous Coward

          いや、別に役に立つんじゃね?
          平安とか鎌倉とかの映像があればおもしろいと思うんだけど?

          > それがいかに馬鹿げたことかを知っているからです。

          この意見には同意。
          自分自身のキャリアには何の役にもたちませんからね。

        • by Anonymous Coward

          とりあえずあなたの知ってるそういうことを言う研究者の研究分野を明らかにしてください。

        • by Anonymous Coward

          大学で数学者の先生がいってましたが、
          「数学者は好きなことして遊んでいればいい。そのうち物理屋と工学屋さんが実用的なものにしてくれるから」
          とか言ってました。
          研究って役に立つかどうかだけ考えてするものじゃないと思うんですよね。
          そういうのを考えるものももちろんあって、上の人はそういう狭い世界だけを見てきたのかもしれないですが。

    • by Anonymous Coward on 2012年10月30日 10時59分 (#2262111)

      ゴミクズを分別するとかいう発想自体が馬鹿の極み

      親コメント
      • by Anonymous Coward
        それは「なぜ」ですか?
        • by Anonymous Coward on 2012年10月30日 13時25分 (#2262284)

          今その時点・時代でのゴミデータはいらないと言うならそもそもこのアーカイブ行為が無駄だから。

          五重塔の落書きとか当時からしたらゴミ、それどころか建設主からしたら犯罪的な行為でしょうけど、
          今その歴史的価値に関して、ゴミデータだっていう人居ないですよね?

          親コメント
          • by Anonymous Coward

            遺跡の中からたった1つ掘り出されるから価値があるのであって、どこの庭でも1m掘り下げれば出てくるようなものなら
            誰も見向きもしないんじゃないですか。

            • by Anonymous Coward on 2012年10月30日 21時22分 (#2262652)

              どこの庭からでも出てくるものでも、
              時間の経過で失われるのであれば、それは未来において有用。
              人間の居住区域の何%分*時間経過の情報があるとしたらとても有用。

              >誰も見向きもしないんじゃないですか。
              君の想像力、見識が足りないから意味を見いだせないだけ。

              親コメント
            • by Anonymous Coward

              > どこの庭でも1m掘り下げれば出てくるようなもの
              そうじゃないから、InternetArchiveが保存しようとしてるわけで。
              どのサーバーでも(サービス提供を終了したものも含む)将来にわたって過去のデータを閲覧できるような仕組みになっていればわざわざ保存しようとしないでしょう。

          • 今その時点・時代でのゴミデータはいらないと言うならそもそもこのアーカイブ行為が無駄だから。

            元コメでは「いずれ」とありますから、 現在がどうこうってことじゃないんじゃないすかね?(・_・ )

    • by Anonymous Coward

      ポンペイの落書きみたいなのを意図的に残そうという試みなんじゃないの?

      歴史を持たない国らしい発想。

    • by Anonymous Coward

      wayback machine で拾わせてもらったデータもけっこうあるが、
      質の優劣で取捨選択する方法論では、人類の 8.3e-9%
      つまりわしの価値観に合ったコンテンツは、残ってねェな^^
      っとは思う。

    • by Anonymous Coward

      今は所持しているだけで有罪になるが一昔前はゴロゴロしていたデータなんかどういう扱いなんだろう?

  • by Anonymous Coward on 2012年10月30日 12時29分 (#2262191)

    昔作ったお馬鹿なサイトが延々時代順にアーカイブされているのが嫌すぎる。

    消せるのか分からないけど、できるとしても、消してもらうには色々手続きが必要なんだろうが、そこまでの英語力もないし。

    • by Anonymous Coward on 2012年10月30日 12時48分 (#2262221)

      まだblogなんて言葉もなかった時代、日記を掲示板のスクリプトを改造して
      公開していましたが、それらは全然残って無いですね
      プロバイダのドメインがor.jpだったから追跡されることもほぼないですね
      #うわーもう十五年かよ、歳は取りたくないな

      親コメント
    • by Anonymous Coward

      問題ないですよ
      知っているのはあなただけw

    • by Anonymous Coward

      urlコピペする程度だけど。

      • by Anonymous Coward on 2012年10月30日 14時27分 (#2262356)

        世の中にはAppStoreやGoogle Playには飽きたらず、Windowsストアでもデフォルトでは日本語アプリしか検索できないようになってるのにわざわざ英語アプリを探しだしてきて「英語だから」というだけの理由で★1つをつける想像を絶するバカがいるんですよ。
        その情熱を少しでも英語の学習に向けたらいいのに。

        親コメント
  • by Anonymous Coward on 2012年10月30日 13時54分 (#2262311)

    「Internet Archive」じゃそのまますぎて味気ない。
    ヒトの偉大さも愚かさもすべて記録して後世に残すこれを、
    ヒトモニュメント計k(ry

  • by Anonymous Coward on 2012年10月30日 14時18分 (#2262345)

    データ収集のタイミングってどう決めてるんだろう。
    数年飛んでたりしてて、この時期のが欲しかったのに、ってことがあった。

    #あと恥ずかしいデータを削除して欲しかったらどうしたらいいの?
    #私のじゃないですよ。

typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...