「ネ申Excel」はなぜ問題なのか 257
ストーリー by hylom
あるあるあるある 部門より
あるあるあるある 部門より
あるAnonymous Coward 曰く、
LaTeX解説書籍でも知られる三重大学の奥村教授が、「ネ申Excel問題」というタイトルの論文を出している(論文PDF)。「ネ申Excel」というのは、データの再利用を考えずに見栄えだけをそろえたExcelデータのことで、「紙への出力しか考えていないExcel」という意味も含んでいるという。
論文では実例とともに「ネ申Excel」について紹介するとともに、なぜこれが問題なのかや対策について解説されている。とはいえ、このように説明されても、なぜこれが問題なのか理解できない(もしくは理解しようとしない)人は多くいそうだ。
タレコミ子はExcelから罫線機能や印刷機能は無くしてしまったほうがよいのではと思ってしまった。
Excelに罫線機能が有るのが問題では無く (スコア:5, すばらしい洞察)
Wordの罫線機能機能がウンコなのが問題なのでは
7行と6行を同じ高さで… (スコア:3)
42行でやるらしい。
もう、何が何だか。
gdgd言わずに神殺し(ゴッドブレイカー)のパーサー書けよ (スコア:3, 興味深い)
gdgd文句を言わずに、ネ申Excelをパースしてcsvに変換できる、神殺しのパーサーをかけばいい。
人間に認識できるんだから、機械に認識できないわけがない。
数字を揃えたり、結合されたセルとかもちゃんと解析すればわかることだろう。
文句をいう暇があれば、パーサーを進化させていけばいい。
プログラマならプログラムで解決するべきだ。
by rti.
印刷ずれ (スコア:2)
ツールとしてはどうしてもこのような使われ方はしてしまうと思う。
ただ、編集と印刷プレビューと実際の印刷がどれもずれてしまうもんだから、Excelが表計算ソフトとしての使われ方ではなく変なフォームの組み合わせになることに拍車をかけているとおもう。
効率よく再利用できたら (スコア:2)
特定の人の仕事が激減するじゃん
資料作成しか仕事のない○○部長とかお払い箱になっちゃうじゃん
というのは冗談として
一般の人には資料を再利用しやすくするために値はあくまで参照(別シートのカラムを指定とか)というのは難しいと思うんだよな。
多分、論文の内容は、MS-Accessが担うべき役割ではないかと・・・・ (スコア:2)
EXCELはデータの分析用ですよね?
分析した結果を見やすくするために、グラフやら、罫線やらが必要なんですよね?
ただ、役所などの公開データがEXCELと言うのは多々あるので、再利用を考えたら確かにやりにくいと思います。
再利用性を考えて、CSVみたいな味も素っ気も無いフォーマットで公開されても、
一般には「見づらい」とか、「情報を公開する気がない」とかクレームが入りそうな気もします。
Access形式で公開されたら、それこそ見れない人も沢山居ると思いますが・・・・
まあ、そんなことを言い出すとPDFで公開されたデータはそもそも再利用不可能に近い(非常に面倒くさい)ので
折衷案としてEXCELと言うのは、現実解かなぁ・・・と思ってみたりします。
#個人的にはHTMLの表でWEBクエリが使える状態で公開されればそれでいいのかなぁ・・・
#などと思ったりします。せめてコピペでなんとかなるレベルにしてほしい。
#もっと言うと、システムの仕様書をEXCEL方眼紙で書くのをやめてほしい・・・
Excel自体がクソ (スコア:1)
なぜCSV中の数字だけの項目を、勝手に数値として解釈するのか・・・。
具体的に言うと、電話番号の頭の0が落ちたりする。
ダブルクォーテーションで括ったり、普通に考えられることは一通りやりましたよ。
Re:Excel自体がクソ (スコア:3, 参考になる)
ExcelでCSVを使う場合、文字コードもネックですな。UTF-8のCSVの場合、
直接開く→Shift_JISとして読み込んで文字化け
テキストファイルウィザードで開く→UTF-8として読み込み可能
なんですが、テキストファイルウィザードで開いたあと、そこで上書き保存すると、Shift_JISなCSVに書き換えてしまいやがります。
私は、もうCSVをExcelからファイル経由で扱うのはあきらめて、クリップボードを通してタブ区切りテストを受け渡し [srad.jp]することにしてます。これならUTF-8でも問題なし。
テキストエディタとしては、MIFESが便利。CSVモードで開いたあと、行を丸ごとコピペする場合、Excel同様タブ区切りテキストとして処理されるので、「MIFESで、CSVモードでCSVを開き、全データをクリップボードにコピー」→「Excelでペースト」すると簡単です。
「数字だけの項目を、勝手に数値として解釈」って問題はクリップボード経由でも解消されないのですが、そういった問題が出た場合、ペースト先のセルを予め書式設定で文字列にしておけば大丈夫です。
「ペーストする」→「電話番号などで0が消えてることに気づく」→「列をまとめて書式設定、文字列に」→「もう一度ペースト」
ということで、テキストファイルウィザードと違って試行錯誤が簡単です。
テキストファイルウィザードで書式文字列指定漏れがあったら、また最初から全部やり直しですから…
テキストファイルウィザードも、読み込み設定を覚えてくれたら、まだマシだと思うんですけどね。
住所録だとか名刺管理だとかのDB的ソフトのCSV入力機能の場合、入力フォーマットを登録しておけるのが多い。それなら、テキストファイルウィザード相当の設定を行うのは最初の一回だけですみます。
Excelはその汎用性ゆえに仕方ないのかもしれないですが、毎回イチイチ指定しなきゃいけないのは面倒すぎます…
Re:Excel自体がクソ (スコア:2, 参考になる)
頭にシングルクォーテーション付けて下さい。
「090」を「'090」みたいに。
Re:Excel自体がクソ (スコア:3, すばらしい洞察)
元データを改変して対応するのは意味がないですよ。
何の為のCSVデータなのか
ああそうかこうしてデータの流通は阻害されていくのだな・・・。
Re:Excel自体がクソ (スコア:1)
lotus1-2-3かmultiplanだったか忘れたけどイニシエからそれよくあるよね
Re:Excel自体がクソ (スコア:1)
今日もシングルクォーテーション付ける仕事が始まるよー
Re:Excel自体がクソ (スコア:2)
CSVファイルの拡張子を.txtにして開くとテキストファイルウィザードが起動するので、それで対処してました。
Re:Excel自体がクソ (スコア:2)
新しいコメントをチェックしてなかった…orz
Re:Excel自体がクソ (スコア:1)
他にもいろいろ問題があるのよね。最新版では解消してるかもしれんけど
・1セル1024文字以上が表示されない
・最も汎用性のある98-2003形式では255列まで
奥村先生のいうようなデータ交換基盤として使うには破綻してるんですよね。
Re:Excel自体がクソ (スコア:2, すばらしい洞察)
>奥村先生のいうようなデータ交換基盤として使うには破綻してるんですよね。
逆になんでデータ交換基盤として使おうとするのかが分からん。
それは既にExcel方眼紙と同様の考えにしか思えん。
ましてやcsvデータからなんて話だと・・・
Re:Excel自体がクソ (スコア:1)
IEEE754形式なので「表計算ソフト」をうたっているのに
丸めが発生して勘定系ではまったく使えない。
Bigdecimalのような機構を持ってほしい。
Re:Excel自体がクソ (スコア:1)
>・1セル1024文字以上が表示されない
これ、セルの表示形式が「文字列」の時ですよね。
(データが文字列でも)設定が「標準」や「数値」や「日付」だと表示されるのが謎。
Re:Excel自体がクソ (スコア:1)
おお、初めて知った。
でもこれだと別のファイル(ダミーの真っ白なシート)を用意しないといけないんですね。
他のやり方としては、拡張子を「csv」じゃなく「txt」とかにリネームしておけばテキストウィザードが開きますね。面倒だけど。
「ファイルを開く」の時の[開く]コンボボックス(?)に「テキストウィザードを使って開く」があればそれでいいのに……。
Excelは悪くないことが判明 (スコア:2)
つまり、CSVをダブルクリックして
Excelに関連付けされている
あるいは、関連付けせざるを得ないOSがわるい。はず。
Re:Excelは悪くないことが判明 (スコア:2)
RFCではダブルクォーテーションで括ったからといって文字列として扱うというルールは無いけど、管理工学研究所が提唱した「K3フォーマット」だと「ダブルクォーテーションで括った場合は文字列として扱う」と明文化してたはず。
Wikipediaの「K3フォーマット」の転送先がCSVになってるけど、CSVのページにはK3の記述が無いなぁ。
Comma-Separated Values [wikipedia.org]
宣伝: Excel からK3フォーマットで書き出すアドオン
SaveAsK3 [takeash.net]
# SlashDot Light [takeash.net] やってます。
Re:Excel自体がクソ (スコア:1)
表計算ソフトでも
登録者コード 値
01-01 0.5
01-02 1.2
とかいうケースあると思うんですけどね。これが
登録者コード 値
1月1日 0.5
1月2日 1.2
とかになっちゃうのが残念。(「'」付ければいけますけど、入力時ちょっと面倒)
神excelってのはこういうのをいうんだぜぇ? (スコア:1)
http://matome.naver.jp/odai/2130768252755665701 [naver.jp]
Re:神excelってのはこういうのをいうんだぜぇ? (スコア:4, 興味深い)
パスポートセンター本所の所在地図はこちら [Excelファイル/26KB] [osaka.jp]が知ってる内では極北。
どうせ、器がExcelなだけで、図形が貼られているんだろう、と思って開いたら、
きっちり方眼紙Excelに、セルの枠や背景色を使って地図が書かれていて、思わず二度見する。
もう少し突き詰めて、斜め線をセルの結合とセル罫線に置き換えるなど、完成度を高めたくはなるけど。
馬鹿じゃね (スコア:1)
なんで文字列データセットへの変換容易性を機械可読性って定義するのか分からん。
マス目に所定のフォントで文字がおさまるってのがデータセットの仕様なら、
座標で解析すればいいだけじゃないか。
はっはっはっわろすわろす (スコア:1)
>マス目に所定のフォントで文字がおさまるってのがデータセットの仕様なら、
>座標で解析すればいいだけじゃないか。
じょ、冗談で言ってるんだよね?
#それと、もまさか本物の馬鹿とか……
この論文はどんな読者を想定しているのか (スコア:1)
それが問題だと思う人にはわかりきったことばかりだし、
それを問題だと思わない人はこの論文を読むことはないと思うんだ。
Web屋の場合 (スコア:1)
自社内はともかく、元請けからくるExcelはグループ化したテキストボックスの集合体だったり、スクリーンショットを貼り付けて吹き出しで注釈をつけたものだったりします。
方眼はそこにあるから使っているだけで、彼らが本当にほしいのはタブ。
テキストボックスのグループ化されるとテキスト選択までの手間が増えるんで嫌なんですけどね。
# と言う世界もある、と。
Re:Web屋の場合 (スコア:2)
自分もそういうExcelファイルを良く受け取ります。
自分の場合、付き合いのある会社全部が、スクリーンショットはExcelに貼付けてきますね。
スクショ貼付けて吹き出しとかWordやPowerPointでもできるんですが、上から下までスクロールしないと目的のページ(目的のスクショ)を探せないWordや、
ページの広さに限界があるPower Pointに比べて、シート毎に分類して一発アクセスでき、ページの広さに現実的な限界が無いExcelの方が使い勝手が良いんですよね。
他に仕様書などのドキュメントがExcelな事も良くあります。
言葉だと、世間で間違って使われているうちに本体の意味が変わってしまう場合がありますが、Excelも本来のスプレッドシートでは無く万能ドキュメントツールとして進化していくかも知れませんね。
同じ理屈で (スコア:1)
ワードに表を入れたりデータを描いたりするのもやめてほしいなぁ。
別途生データを用意してくれるならいいが。
あと仕様書も。章立てするならパワポの方がまだまし。
ワードこそネ申であるべきなんだよな。
// 僕は絶対使わないというかワードは滅びろと思っている(:>^
Re:同じ理屈で (スコア:2)
Publisherはとりあえず日本語に対応してるだけの残念な出来なので,あっても無いような物かと。
InDesignは現状,高機能化しすぎて一般の方には難しいのではないでしょうか。
PageMaker6の辺りなら,ワープロの代わりになったかも,ですね。
まあ,あたしは入力はWordで,割り付けはAIまたはIDてな感じですか。
Wordは,きちんと使いこなせば,文章を書くには最適なツールですよ。
まさにワープロ。アウトラインプロセッサとしては優秀な部類かと。
EXCEはBASICに似ている (スコア:1)
セル参照が列、行指定だとか、BASICのGOTO文で行番号を指定してるのと同じですよね。
もともと一画面ぐらいで完結するような物だったのが、ユーザーの要求に建てましにつぐ建てましで対応してるうちにグダグダに。
(セルの連結とかも使い勝手はともかく、仕様としてはなんだかなあですし)
BASICの方は新しい言語がどんどん出来て、そっちに移行していったのにEXCELはそのまんまになっちゃった。
ロータスImprovが出た時には、やっと新しい物が出てきたと思ったんだが、すぐに消えてしまったし
結局、新しい物でなく、これまで使ってきたもので何とかしたいという使用者のユーズの違いなんでしょうね。
これから新しい表計算ソフトを作ろうとしたら、表面的にはEXCEL風に使えるモードが絶対必要だろうなあ。美しくないけど。
問題を本気で解決したがってるようには見えない論文 (スコア:1)
いつも思うが、皮肉を交えた批判って、自分の溜飲を下げて、相手を不愉快にさせているだけで、問題解決の役にはあまり立たんよな(全く役立たずとは言わないが)。本来、問題とは互いに協力して乗り越えていくものだが、相手を不愉快にしたら意固地にさせてしまう可能性が高く、解決への道が遠くなる気がする。
Re:そりゃダメだろ (スコア:1)
データ集計主体の時は罫線付けないね、印刷が必要なシートだけたまにそうする。
こういう機能ほんと人の使い方それぞれで必要不必要が激しいなぁ。
なんだかんだ一切合財取り込んでユーザも取り込み続けて今のExcelがいらっしゃるようだ。
Re:そりゃダメだろ (スコア:1)
ふと思ったのだが、世に「方眼紙ソフト」ってものは無いんですかね。
きっちり正方形のセルで構成されてて、
文字入力モードでは長文入力しても一マスごとに一文字が配置され
設計モードでは多種多様な罫線斜線曲線が引ける。
表計算ソフトほど複雑な計算機能は無くていい。
文章作成ソフトほど精密なアウトライン管理機能みたいのもいらない。
寡聞にして無知なんですが、時々見かけるvisioとかpublisherとかが相当するんですかね?
Re:そりゃダメだろ (スコア:1)
CADソフトでグリッド表示を方眼紙タイプに変更して必ずスナップするようにして機能を絞り
方眼紙(グリッド)に字を書きこみやすく編集しやすくすればそうなるのかな。
っとまだまだもやーっとしたものしか思い浮かばない・・・
CADソフトやDTPソフトだと方眼紙として使いたい人にとっては自由度が大きすぎたり機能がありすぎてかえって使いにくいだろうし。
でも、それだけじゃなくてたまには集計したりマクロ使ったりしたくて結局はネ申Excelにひれ伏す。
Re:問題は神ではなく人間のほう (スコア:1)
元々紙の帳票主体で仕事してた人たちが、帳票をきれいに出力したりテンプレートを使いまわして便利にするためにネ申Excelが出来上がってったんだろうと邪推。
そもそも使い道が違うというか、ネ申Excelユーザにとってはひな形の再利用なら理解できそうだけど、データを再利用するということ自体理解できないと思う。
きっとビッグデータとかからは遠く離れた世界
総務や経理系の人たちと仕事すると。
なんでExcelに入れるデータでいちいちここのセルには半角英数字でとかこっちは全角英数字でとか縛りがあるのかこちらは未だに理解できないけど、彼らからしたらきっとこっちが遠く離れた世界。
Excelシートにデータ入れて渡す時には、必ず一番上の左端にカーソルがあってないと激怒する人が実際にいたのには度胆抜かれた。
Re:問題は神ではなく人間のほう (スコア:3, 興味深い)
リア経理ですが日頃の愚痴をば。
エライ人なんかは確かにそんな感じですね。紙とペンと複写シートなんかが現役時代の道具だった人ね。
あの人達は一筆入魂で仕事してたのだから何か美学が有るんでしょうね。
でも今現役の若い世代(と言っても人の出入りの無い職種なんで30台前半だったりですが)は人員削減の中、日頃の膨大な取引データを処理しなきゃなんないんで裏ではちゃんとビューとデータに分けてたりしますよ。
表に出る帳票なんかは最早チェックと承認しかしなくなったエライ人が作るもんだから紙出力が見易い以外は無考慮のいざ入力するとなるとペンがキーボードになっただけ、罫線引いた紙にタイプライターで打ってるみたいな使い心地のシートになるわけですわ。
オマケにペーパーでフロー流れてないと見辛い印刷めんどいとかって言うもんだから下っ端経理に流れ着く頃には生データ何てものは入手困難で手打ちで帳簿に入力しなおさないとならん二度手間。
データの再利用何て全く考えに無い。ペン持って紙から紙へ転記するのが普通と思っているから。
オフコン世代もこの液晶タイプライターに慣れてるから疑問に思ってないし…
ズラズラ愚痴ってしまったけど、ナニが言いたいかというと、今の現役世代が偉くなる頃(10年は先かな…)迄は経理サイドは頓珍漢なシートを量産するだろうってこと。
Re:問題は神ではなく人間のほう (スコア:1)
知能が極めて低いだけで、認知機能の障害とはいえないとは思いますが、
(重要かどうかはともかく)Excel を使うような業務から除外する必要があるというのには同意です。
Re:ツールを (スコア:3, すばらしい洞察)
自分(達)のためだけに使うならもちろん自由ですよ。
でも、内容に公益性があり、二次利用を考慮すべき文書が「ネ申Excel」だと困りますよね、って話です。
該当論文には、ダメな例として福島の原発事故後の放射線量を列挙したExcelなどが挙げられています。
数値がなぜか文字列になっていたり、そのせいでTypoが何箇所もあったりで、再利用性が著しく低い状態だということです。
東電がこれを指して「Excelをどう使おうが自由だ」などと言い出したらみんなブチキレますよね?
Re:ツールを (スコア:2)
Re:ツールを (スコア:1)
だから, ちゃんと論文読みなさい.
正規化された形式なら, そういう入力間違いのチェックを機械的に行えるから信頼性が向上すると指摘しているんですよ.
Re:ツールを (スコア:2)
Excel と Word と PDF を比べている段階で、意味を取り違えている。Excel にしろ、Word にしろ、PDF にしろ、所詮は、人間にいかに見せるか、というソフトにすぎない。
「ネ申Excel」はその究極ってこと。
一方、データの再利用とは、計算機により自動的に処理する事を言う。そのために利用しやすい形態としては、CSV, XML, 最近では JSON などがある。そういうかたちでデータが公開されれば、生産性が格段にあがるはずなのに、意味不明な Excel フォーマットでデータ公開されるのは、ビッグデータ全盛のこの時代にとっては、非常に残念、という話。
Re:ツールを (スコア:2)
特にIT技術の場合は、それに加えて、道具を上手く使うというのは、内部的なデータ構造が綺麗に整う事に直結する場合が多いので、作られたドキュメントの再利用もしやすくなる。
ので、その手のツールの「何となく触ってると直感的に操作できる」というのに頼ってほったらかしにせず、きちんとツール使用者を教育すると色々ハッピーになりますよ、と。
ただまあ、1日中、計算機片手にExcelの帳簿を埋める仕事をやってるおじいちゃんが大変そうだったから自動で計算が終わるマクロを組んであげたところ、 その仕事が無くなったおじいちゃんは力仕事の部門へ回されることになって申し訳ないことをした、みたいな話を見たことがある(ググってもソースを見つけられなかった)ので、場合によるのかも知れないけど。
能率の悪い仕事を延々とやってる方が楽なんだ、ほっといてよ、と言う意見も、心情としては理解出来る。
Re:ツールを (スコア:1)
かつて大きなシェアを誇ったロータスは1-2-3に変わってデータの表示と格納を分け、美麗な印刷とデータ交換を両立させるImprovを最初はNeXTで、次にWindowsでリリースしましたが、Windowsではユーザはそれを選択せず高機能方眼紙ソフトのExcelを選択した。
結局 #2482275 [srad.jp] の指摘の通りほぼ全世界のExcelユーザにデータの再利用って概念が無いんでしょうな。
鯖江市 [fukui.jp] みたいにどこもデータと表示様式を分離してくれれば便利なんでしょうが、法律或いは省令または工業規格かなんかで強制しない限りネ申Excelは無くならないでしょうね。
仕様です>紙に出力するとレイアウトずれる (スコア:2, 興味深い)
異なる複数の Windows 環境で Excel ファイルを共有すると、印刷範囲、セルの幅、または高さが変更される場合がある [microsoft.com]
MSの言い分「Excelは表計算ソフトでレイアウト用のソフトじゃないから、そういう余計な機能はカットしてその分高速化したよ。Excel方眼紙?はぁ?レイアウト目的ならWordやDTP使うだろ。」
つまり日本人がExcelの使い方を間違えてるだけ。
Re:PDFもあんま好きじゃない (スコア:1)
/.Jにも奥村先生を知らない人がいるのかというオドロキ
Re:筋違いだ (スコア:1)
論文は「紙への出力のみしか考えていないとしてそれが目的で作った」ってのを止めろ、再利用が可能な形にしろってのがメインだと思うけど。
的外れな部分があるのも確かだけどね。
Re:生データと文書の区別がついていない。 (スコア:2, 興味深い)
DOVパターン(Data-Operation-Viewパターン)
http://blog.katty.in/4143 [katty.in]
を広めよう(提案)
Re:単なる宗派争いにしか (スコア:2)
Excelマンセーとは言わないが、PDF派に関しては異議を唱えたい。
役所のクソPDFを見た上で言っているのかと。
PDFとはいえ中身は適当にスキャンした画像に過ぎず、解像度が低くて画素は荒くなり、クリアテキストすらなく、あまつさえ傾いていて一部が見切れているような、再利用性どころか一度の利用すらままならないものがご所望かと。