アカウント名:
パスワード:
俺もマスコミは嫌いだけど、恣意的に貶める記事書いて楽しいですか?いい性格してますね。三流記者に向いてますよ。文章で10MBはビックデータでしょうよ。
ビッグデータというのは、ほとんどすべての情報を選別せずに機械的に溜め込んだもの。その中から必要な情報、重要な情報を抽出して記事にまとめたものが例えば、出版物や放送番組になる。
だから、新聞記事をビッグデータと呼ぶためには、例えば100年分の新聞記事を全部、などという扱い方が必要であって、○×△に関する記事などという風に抽出したものをビッグデータとは呼べないだろう。
> ○×△に関する記事などという風に抽出した
条件付けが「震災後1週間分の本紙掲載記事」などといった期間指定だけであって、その中身に選別がないなら、一種のビッグデータといっていいかと思います。
できれば、1週間ではなく1ヶ月ぐらいにしておいたほうがいいんじゃないかとは思いますけど、ていうか、NHKの「震災後24時間」というのは短すぎかなぁ…
単純な検索でデータを選別するだけの場合、ビッグデータと呼べるのかなぁ?数理解析や統計的処理を行うことで、生データにはない役立つ情報を生成可能なデータのことをビッグデータと呼んでるようにも思いますが…。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stableって古いって意味だっけ? -- Debian初級
は? (スコア:0)
俺もマスコミは嫌いだけど、恣意的に貶める記事書いて楽しいですか?
いい性格してますね。三流記者に向いてますよ。
文章で10MBはビックデータでしょうよ。
Re: (スコア:2)
ビッグデータというのは、ほとんどすべての情報を選別せずに機械的に溜め込んだもの。その中から必要な情報、重要な情報を抽出して記事にまとめたものが例えば、出版物や放送番組になる。
だから、新聞記事をビッグデータと呼ぶためには、例えば100年分の新聞記事を全部、などという扱い方が必要であって、○×△に関する記事などという風に抽出したものをビッグデータとは呼べないだろう。
Re: (スコア:1)
> ○×△に関する記事などという風に抽出した
条件付けが「震災後1週間分の本紙掲載記事」などといった期間指定だけであって、
その中身に選別がないなら、一種のビッグデータといっていいかと思います。
できれば、1週間ではなく1ヶ月ぐらいにしておいたほうがいいんじゃないかとは思いますけど、
ていうか、NHKの「震災後24時間」というのは短すぎかなぁ…
Re:は? (スコア:0)
単純な検索でデータを選別するだけの場合、ビッグデータと呼べるのかなぁ?
数理解析や統計的処理を行うことで、生データにはない役立つ情報を生成可能なデータのことを
ビッグデータと呼んでるようにも思いますが…。