河野大臣、Excelにありがちなダメな書き方など対策を示した案をツイート 145
ストーリー by nagazou
政府から出てくるとは 部門より
政府から出てくるとは 部門より
河野太郎行政改革担当大臣が25日、Twitterにて「機械判読可能なデータの表記方法の統一ルール案[PDF]」について投稿を行った(統計表における機械判読可能なデータ作成に関する表記方法[PDF])。Excelにありがちなダメな書き方の例と望ましい作成方法をまとめたもの。指摘されている内容は先日の「Excelのデータってありますか」の話に出てくるような内容をルール化してまとめたような内容となっている(河野太郎、窓の杜)。
具体的には、1つのセルに複数のデータを入れない「1セル1データの原則」や「数値データに文字列を含まない」「セルは結合しない」「スペースで体裁を整えない」「体裁のために空白行を入れてデータが分断されていないか」などといった項目が20ページにわたってまとめられている。もっとこうしろなどの指摘については「統計表における機械判読可能なデータの表記方法についての意見照会」で12月1日まで意見募集しているとのこと。
ドラフト版のリンク切れに伴い正式版のリンクを追加(2021/03/17)
具体的には、1つのセルに複数のデータを入れない「1セル1データの原則」や「数値データに文字列を含まない」「セルは結合しない」「スペースで体裁を整えない」「体裁のために空白行を入れてデータが分断されていないか」などといった項目が20ページにわたってまとめられている。もっとこうしろなどの指摘については「統計表における機械判読可能なデータの表記方法についての意見照会」で12月1日まで意見募集しているとのこと。
ドラフト版のリンク切れに伴い正式版のリンクを追加(2021/03/17)
やりがち (スコア:5, 参考になる)
うちはそんなの無いよ!と油断していると、営業が入力するお客様データの名前や社名の後ろに「様」や「殿」や「さん」が付いていたりとか、金額入力欄にカンマの積もりで「.」を入力していたりとか、昔から良くある話であります。
本当に一度目を通して欲しい。
本当に一度目を通して欲しい。
ずっと目を通して欲しい。
Re:やりがち (スコア:1)
金額入力欄にカンマの積もりで「.」を入力していたりとか
販売に関わる人・営業でこんなことをやる人は見たことないなあ。
入力ミスならある話だけど、それは営業に限った話では無い。プログラマだってやらかすときはやらかす [konogi-tools.com]。
Re:やりがち (スコア:1)
確かに入力制限は必要だけど、それでも入力されてくる謎のデータ群を綺麗にしなければならないのであります……
Re:やりがち (スコア:1)
> 数字のカンマとピリオドの使い方が、逆なんだよ。
そうですよね。ヨーロッパ全体でそのようです。
ISO(?)でもそうなっているというストーリーがあった気がします。
で、上と逆に小数点をカンマにするレポートがよくあるので
お前さんはヨーロッパ人かとコメントすることがあります。
maruken
Excelアクセシビリティ? (スコア:4, 興味深い)
以前miCheckerという総務省が作ったWebアクセシビリティチェッカーで「空白を使って均等割り付けするな!読み上げられないだろ!」と怒られた覚えがあります。1.5の「スペースで体裁を整えていないか」というのは、機械にとっても問題ありってことですね。
このチェッカーツールも平成28年から変わっていないようで、まだOracleのJava8使用が前提となったままです。大臣に本当にやる気があるのなら、Excelチェックツールを作って通ったものしか受け取らないとかしてみてはどうでしょう。
よもや長州力氏みたいな人が官公庁に居るとは思えないが…… (スコア:3)
どんな人を対象にしてるかにも依るけど、同じ数字・英字でも全角文字と半角文字は別だとか、見た目は似てても「#」と「井」は違うとかも……いや、流石に必要が有ったら、職場の新人教育で教えるか……。
日時はISO 8601で (スコア:2, 参考になる)
基本形式(YYYYMMDDThhmmss+0900)または拡張形式(YYYY-MM-DDThh:mm:ss+09:00)のどちらかに準拠して欲しい
関連リンク:米国と欧州の日付フォーマットの違いにより、児童ポルノ送信容疑をかけられたスペインの家族 | スラド IT [it.srad.jp]
Re:日時はISO 8601で (スコア:1)
毎日新聞「日本語のサイトなら日本時間で書かれてるに決まってるでしょ!」 [srad.jp]
Re: (スコア:0)
機械処理するデータとしてなら賛成。
人が読むための物だと、YYYYMMDDは視認性が悪く、YYYY-MM-DDは範囲を表す記号に悩む。
Re:日時はISO 8601で (スコア:1)
> 機械処理するデータとしてなら賛成。
機械処理するなら Unix Time 以外に選択肢ないでしょ……
てか、Excel で日付表示になっていても、実データは Unix Time でしょ。
Re:日時はISO 8601で (スコア:3)
えぇっ?
2038年って意外と近いと思うんですよ
Re:日時はISO 8601で (スコア:2)
その頃はとっくに現役引退してるし
2000年問題のときも大きな問題なかったから大丈夫
と無責任なことを言ってみる
Re:日時はISO 8601で (スコア:2, 興味深い)
Excelの日時の内部表現はUnix Timeではありませんよ。1900年1月1日と1904年1月1日の2種類です。
Excel の1900と1904日付システムの相違点 [microsoft.com]
Joel On Software私訳 なぜMicrosoft Officeファイルフォーマットはこんなにもややこしいのか (そしてその対処法を幾つか) [hatelabo.jp]
Re:日時はISO 8601で (スコア:2, 興味深い)
御参考:
Office Open XML の日付時刻の取扱い - Qiita
https://qiita.com/shota243/items/340d804a1c51b7b39d1e [qiita.com]
Re:日時はISO 8601で (スコア:1)
UNIX システムコール time は、「エラー時に-1を返す」仕様だったりします。
-1と比較せず、「0でエラー」って実装も見かけますし、
安易にtime_t を signed にするのはトラブルの元です。
テスト通過したものしか受け取らない (スコア:2)
スペースや結合をチェックするツールを作ってもらってそれを通過したものだけを受け取るようにしてもらえれば・・・
# テストを通過したものだけ・・・おや・・・どこかで聞き覚えが・・・
データと印字イメージの分離 (スコア:1)
データ用シートと印字用フォームは分けた方がいい……そんなことを主張したら、AccessDBを渡された。
Re:データと印字イメージの分離 (スコア:1)
レイアウトって言うなら、印刷時のレイアウト崩れの問題はどうなのかね?
それと、目次が必要だとExcelは致命的にダメだね。
Re:データと印字イメージの分離 (スコア:1)
レイアウトは常に必要なのか?
印刷も目次もレイアウトも、必要な場合もそうでない場合もあるね。
和暦はいらない (スコア:1)
「和暦のみは禁止。必ず西暦を併記」はまあいいと思うけど
本質的には西暦のみでいいんじゃないかなあ
和暦って必要?
Re:和暦はいらない (スコア:2)
必要としている人には必要としか言えないよなぁ。
つまり、アメリカ人に「ヤードポンド法は必要?」って聞いてるのと同じ事です。
Re:和暦はいらない (スコア:2)
別なんだけど結局は必要になるって話。
手放したくないという意思はあっても必要になっちゃうから必要としか言えないという話。
アメリカ文化の中にヤードポンド法が根付いちゃってるから、
アメリカに住むあるアメリカ人が自分一人だけヤードポンド法を手放してメートル法使うぞって意気込んでも
周りはすべてヤードポンド法なわけで、それでは生活ができないんですよ。
つまりアメリカ国内で生きていくためには結局ヤードポンド法は「必要」という話になる。
つまり(#3932055)の人も言っているが、自分の会社が西暦のみの書類を作成しても、重要顧客が和暦を採用していたら
自分達もそれに合わせなければ商売ができない。
つまり手放したいけど結果的に「必要」になる。必要としている人には必要としか言えない。
Re: (スコア:0)
お役所は和暦を使う事になってるし
まあ今の与党の立場的に和暦は否定し辛いからそこらへんはね
Re: (スコア:0)
エクセルに入力する元データがそもそも和暦だと入力時・検証時には和暦もあった方が都合がいいでしょう。
西暦から逆変換するとしても、元データが平成32年以降の場合どうすんだとかありますし。
# 運転免許証は平成36年まで有効と記載されているものまであるそうです。
西暦併記になったのも改元直前ですし。
Re:和暦はいらない (スコア:1)
> 西暦から逆変換するとしても、元データが平成32年以降の場合どうすんだとかありますし。
むしろ西暦から和暦の変換が難しいのは明治5年の改暦以前ですけどね!
でも、Java の Calendarクラスは、月番号が(0から)12まであるから、
閏月余裕で表現できるので、真面目に実装したらできますけどね!
#ただし不定時法までは無理
一式 (スコア:1)
積算で一式は単価を書かない、というルールがあった(単位書かずに数量が一式だったかも。
たしか式は単位でないとかなんかだったかな?二式などというものは無いとか)。
単価×数量が使えないので面倒で数量が1式の時は単価を見えなくするとかしていた。
第一正規形 (スコア:1)
#日付時刻形式は別途考えるとして
これらに反する場合 (スコア:0)
どれほど罵倒叱責しようと、法律でパワハラ扱いとしない、事が望ましい。
Re: (スコア:0)
なんでそんな感情的なの
突っ返してOKってするだけでいいじゃない
Re: (スコア:0)
権力も能力もないドカタコーダのストレス源だから
てか、機械判読できないものをエクセルで作れんの? (スコア:0)
機械判読側の情報量が少ないだけじゃね
こんなのを大臣から出すのか (スコア:0)
内容は有意義だと思うけど、
要はダメな例が官公庁でも横行しているということだろ。
役人は無能揃いということだな。
情けない。
Re:こんなのを大臣から出すのか (スコア:2)
役所だけでなく、民間でも「あるある」ネタじゃないですか。決定権あるポストにIT系に詳しい人間がいない場合にありがち。
Re:こんなのを大臣から出すのか (スコア:1)
Excelに代わるものを生み出せない人類が悪い。
Re:こんなのを大臣から出すのか (スコア:1)
Re: (スコア:0)
有能だからオレオレルールで業務が回せるんですよ。
Re:こんなのを大臣から出すのか (スコア:1)
どうしてその前例が出来たのかも調べもしないで、「こうだから」って押し付けるような変更は改善では無く改悪です。
そもそもエクセルって (スコア:0)
Re:そもそもエクセルって (スコア:1)
それはPowerPointでは(違
Re:そもそもエクセルって (スコア:1)
Wordが使えないから、Excelを使って文章位置を細かく調整し始めたのが悪習の根源
それが大きな原因であることは確か。それは認めるとして。
まず、Wordの出来の悪さは、日本固有の問題ではないですよね。
なのに、Excel偏重問題が海外からあまり聞こえてこないのは何故なのか?
日本は必要以上に見た目に拘り過ぎてるんじゃないでしょうか。
無くても良い罫線に拘り過ぎるとか。
次に、Wordが使えないのは、一つには文書作成技法を学ばないから、というのもあるんじゃないですかね?
章立てのある文書の作成方法って、少なくとも日本では、高校以前には習わないよね。
文書作成技法を知ってて、それに従って作成しようとするなら、Excelを選ぶってことは無いと思います。生産性が低すぎる。
これも、見た目に拘り過ぎた結果かも。
Re:そもそもエクセルって (スコア:1)
まず、Wordの歴史的な経緯を共有する必要があります。
MS officeシリーズがリリースされたのですが、当時は一太郎や松がシェアが圧倒的でした。
その時にWordを使わない理由として挙げられたのが罫線等の装飾の弱さでした。
これには時代的な背景があって、今ほどカラー印刷が一般的では無く、しかも画像が全く無い状態で文字だけで文章の見栄えを良くする時代があったのです。
そこで活躍したのが色々なパターンの罫線でした。
このバリエーション豊かな罫線によって、文字だけの文章を綺麗に”印字”する事が出来ました。
Wordが普及しない理由として指摘されたのが罫線のバリエーションの少なさでした。
それを受けてMSは競合他社に負けないバリエーションの罫線を大量に用意する事になりました。
こうしたMS office暗黒時代はwindows普及時期まで続く事になります。
時代は流れてMS officeが独占的に市場を抑える事になります。
相変わらずWordは使えない状態ですが、そこそこ使っている人がいる状態ですが、まだ一太郎が元気でいます。
理由はパソコンで作成した文章を印刷するには一太郎には敵わなかったのです。
でも時代はインターネット時代
Excelを使って、そのままExcelファイルにユーザーに注文表に記入して貰う事が大流行
こうなると印字する必要はありません。
また注文表に必要だった記入欄を太い罫線で囲う必要もなくなり一太郎も優位点もなくなります。
一般的な文章を印字する為だけに一太郎を買う人も少なくなり、ATOKだけ欲しい人が大半を占めました。
ここで印字する文章をWordが補完してくれたら良かったのですが、全くできませんでした。
求めていたのはPower Pointのように自由に文章を1ページ内に自由に配置できる事でしたがWordでは全くできません。
そこでExcel方眼紙といった手法で代用する人が出てきてきました。
ここにはMS Officeの標準パッケージにはPowerPointが入っていなかった事が原因です。
日本人が求めていたのは文章を段落毎に自由に配置が出来る自由な配置と、罫線で文章を囲うのが大好きって人が多いって事が挙げられます。
Re:そもそもエクセルって (スコア:1)
注文表(票?)云々はともかく、だいたいの流れはその通りだと思います。
で、
日本人が求めていたのは文章を段落毎に自由に配置が出来る自由な配置と、罫線で文章を囲うのが大好きって人が多いって事が挙げられます。
これは何故なんでしょう?
日本以外でそうならなかったのは何故なんでしょう?
書いてもらった流れは、それを全く説明してませんよね。
Re:そもそもエクセルって (スコア:1)
なんか理屈がおかしい気がしますね。
言語の持つ情報密度が高い、と言うのなら、罫線以外に余白を大きくとる、という方法でも区切ることが容易になるのでは?
逆に、情報密度が低ければ、同じ情報量でもたくさんの文字を配置せねばならず、余白を取りにくくなり、より罫線に頼りがちになりそうです。
仮に情報密度が原因だとしても、言語の持つ情報密度、と言うよりも、単に情報密度が高いのを好むか否かによるんじゃないでしょうか?
Re:そもそもエクセルって (スコア:1)
そもそもExcelで資料を作ろうとするから悪いんだよね
違うだろ。
Excelに向いてない資料を作ろうとするのが悪い。例えば仕様書とか。
どうせ馬鹿みたいに (スコア:0)
使い方や使いどころの問題なのに、「機能を使うこと自体が悪」としちゃうんだろうな
Re:どうせ馬鹿みたいに (スコア:4, 興味深い)
あー…某社の総務課勤務(派遣)のときに社員カードを作ってくれと言われ、
カードのテンプレと社員リストを渡されたので、Excelの「差し込み印刷」を
利用して作ったら白眼視された記憶が蘇りました。
…私たちが知らない機能を使って楽をするのはズルい!らしいです…。
/* 実は実話です */
死して屍 拾う者なし
Re: (スコア:0)
まともな判断ができない人もいることを考えると、使い分けを強要するより、使わせないほうが現実的でしょ。
Re: (スコア:0)
表計算ソフトのExcelそのものに計算を直接的に邪魔する整形機能が付いてる方が悪いから仕方ないね。機能そのものが悪。
セル書式はなし? (スコア:0)
カンマ区切りやコマーシャルマイナスは書式の出番のような。
Re:セル書式はなし? (スコア:1)
ちゃんと報告書にはセル書式も取り上げられている。「ただし、書式設定を施したExcelをcsv化すると、思わぬ挙動を示す場合があるため、印刷を意識した報告書ベースのExcelにのみ使用する等、使い分ける必要がある。」という注意書きもある。