経済産業省、オープンデータ推進のための実証用サイトを公開 14
ストーリー by reo
公開してこそ価値が倍増 部門より
公開してこそ価値が倍増 部門より
ある Anonymous Coward 曰く、
1 月 28 日、経済産業省は白書や統計などの公表データを民間等で活用してもらうため、加工しやすい形で保有データを公開するオープンデータ化を進めている。その一環として、「Open DATA METI」を公開した。
とりあえず、中小企業実態基本調査、工業統計調査、商業動態統計調査、商業統計調査、総合エネルギー統計、知的財産活動調査と通商白書、中小企業白書、エネルギー白書にアクセスできる模様。使い勝手の改善のため、現在ご意見募集中とのこと (経済産業省のニュースリリースより) 。
ざっと見た感じ (スコア:0)
pdfとxlsファイルばっかり
利用しやすい……?
データの統一より、公開が第一でいいと思う。 (スコア:2, すばらしい洞察)
どんなデータ形式でもできることからこつこつやってくれるのならうれしいです。
あとは、ユーザー側で使いやすいように再加工してありがたく利用させていただきますので。
Re: (スコア:0)
同感。
先ずは使える人が使えればそれはそれで良い。
そこで無理に原理主義に走ると、公開側の環境が揃うまで始まらない。
しかも下手すれば卵とニワトリの問題よろしく、「データが無いから移行しない」し「移行しないから公開もしない」と成り得る。
それを考えれば、先ずはデータ形式は「推奨」程度で十分だろう。
そう考えれば先ずは「先陣を切って公開してくれたものに感謝」で良いと思う。
閲覧性として見ると、PDFやXLSで有ればそれほど問題は無いと思うんだけどね。
再利用だって別段難しくなく出来るのだし。
Re: (スコア:0)
完璧を目指しすぎちゃうと、再利用性の高いデータとは何か、みたいなところで議論が起きて、いつまで経っても公開されなかったりしますしね
Re:ざっと見た感じ (スコア:1)
# yes, fly. no, fry.
Re: (スコア:0)
無駄に成形されてるし、1枚のシートに複数の表を載せてるし、印刷用に作ったxlsをそのまま載せてる感じですね。
これが役立つのはコピペするときぐらいでしょう。
これからどのくらい改善されていくのか生暖かく見守るとしよう。
Re: (スコア:0)
今日もExcelで作られたチェックシートの該当箇所にオートシェイプで○をつける作業が始まるお・・・・
それが終わったら集計表に目視で該当数を数えて手打ちしていくんだ・・・
文字の並びをそろえるためにセルを結合してセンタリングして半角スペースで微調整するんだ・・・
特定アプリ非依存ということで (スコア:0)
PNGとかCSVテキストでいいんじゃないかと。
Re: (スコア:0)
統計データ(テキスト)が画像化されたPNGに載っている、という嫌な想像をしてしまった。
すなおにDB公開と集計用Veiw系コマンド紹介で… (スコア:0)
たぶん1日回1ジョブが運良く走れば…の世界でしょうが(走召糸色木亥火暴)
"castigat ridendo mores" "Saxum volutum non obducitur musco"
ブラウザでデータが見られるようになれば (スコア:0)
良い試みですよね.
ダウンロードする元ファイルがXLSとかPDFってのはアリ.
ただし,HTMLベースでざっと見たいという意見もあるはず.
これ[datameti.go.jp] http://goo.gl/BnBaq [goo.gl] を見る限り,
データ作成段階から見なおす必要がある気がする.
従来とは違うデータ形式を構築できればうまくいきそうですが
作成方法の変更とかやる気あるんですかね.
(イメージ)データをグラフ上で軸と変数を自由に選択してプロットする
-
データプール←ミドルウェア←解析コマンド←ユーザ
↓
対象データ抽出→ミドルウェア→ユーザ指定形式のデータ→ユーザ
Re: (スコア:0)
データ形式についてはGoogle Driveでも公開すればかなりの部分解決のような。
XLSならスクリプトでもデータがとれますので、下手にセマンティックを気にしてXMLとかにされるよりもいいと思います。PDFは確実に本文を抜き出せればいいんですけれどね。
私はニュースで気になったことがあったりすると、それなりの頻度で統計データをgo.jpからもらってきて眺めてみるのですが、検索でヒットするのが最新のデータではない、URLに規則性がないので年ごとの推移が調べにくい、といった部分が不満でした。
同じ場所に集約してくれるのはとてもありがたいですが、ファイル名の命名規則もちゃんとしてくれるとなお嬉しいです。ローマ字と英単語の混合とか、年度によってファイル名の付け方が違うとか、バッチ処理でのダウンロードが難しいですから。
Re: (スコア:0)
命名規則が異なっていたことは知りませんでした.
確かに命名規則が統一されていないのは大きな問題ですね.
そこだけはぜひ修正してほしいです.すでに何らかの解析方法を
確立している人にとっては, それで十分かもしれませんね.
ニーズ (スコア:0)
放射線量とか地震系が人気があると思う。命に直結するから