アカウント名:
パスワード:
WindowsのバックエンドもUnicode化してきてるんだから,ExcelもUTF-8サポートしてほしいわ.CassavaがあるからまあなんとかなってるけどLINUXWINのCSVやり取り,利便性悪い.
バックエンドはWindows NT 3.1の太古の昔からUnicodeで、最近Unicode化を進めてるのはむしろフロントエンドだよ。Excelは関連付けで開くとUTF-8のファイルが文字化けするけど「外部データの取り込み」でインポートすれば文字コードを指定できたような
まあ要は元コメは、CSVをダブルクリックしたらEUCかJISかShiftJISかUnicodeかUTF-8か自動判定してくれればいいのに、って言いたいだけじゃね?
# UnicodeとUTF-8を別物扱いされるともやるのでAC
UnicodeとUTF-8は別物です
#MSがUTF-16LEのことをUnicodeと称するのは止めにしてほしい#文字コード関連の正しい知識を一般人に求められないのは当然だが、それでも、誤用を広めるのは害悪でしかない
無能な奴ほど自分が無知だと疑わずに道具の文句を言う
いや、ExcelはUTF-8対応してるが?Excelが対応していないのはUTF-8N(BOMなしUTF-8)で、BOM付きのUTF-8なら対応している。実際やってみれば文字化けせずにちゃんと読み込める。タレコミにだって
このうちCSVファイルはBOMなしのUTF-8で保存され、エクセルで文字コード指定なしで開くと文字化けすることから、「文字化けしてる!」という声がネットで見られます。
と書いてある。
まぁ、UTF-8ではBOMに関しては許容するが推奨はしないという扱いのはずなのでBOM付きUTF-8という存在は微妙ではある。
ZWNBSP (U+FEFF) がファイルの先頭に入っている UTF-8 の CSV (カンマ区切り) か、BOM 付き UTF-16BE の CSV (タブ区切り) でどうぞ。
「ZWNBSP (U+FEFF) がファイルの先頭に入っている UTF-8」とか書く癖に「BOM 付き UTF-16BE」の方は気にしないのがモヤッとしますね。
CSVは仕様と言える仕様がRFC 4180しかなくて、RFC 4180は実質US-ASCIIしか想定してない(※)し、データ交換に使うにはあんまり向いてない。(RFC 4180も「こんな感じなら大体読めるんじゃないかなー」というレベル)
実際の仕様は各処理系の定義によって、Excelの定義では「エンコードはUTF-16LEまたはANSI CPとする。ファイルの先頭がEF BB BFになっていればCP65001として解釈する」になっていると思われる。
処理系はそれぞれ「俺の考えるCSVの仕様」を(明示的か暗黙的かは問わず)定義しているはずなので、データ交換時に互換性がない処理系を結ぶなら当然それは整えてから渡してやらないといけない。
オフトピですがMicrosoft Excelはダブルクオートを全く使わないのよとか書くならフィールド内(セル内)改行はLF使ってることも書いておいてくれればいいのに。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
UTF-8 (スコア:0)
WindowsのバックエンドもUnicode化してきてるんだから,ExcelもUTF-8サポートしてほしいわ.
CassavaがあるからまあなんとかなってるけどLINUXWINのCSVやり取り,利便性悪い.
Re: (スコア:0)
バックエンドはWindows NT 3.1の太古の昔からUnicodeで、最近Unicode化を進めてるのはむしろフロントエンドだよ。
Excelは関連付けで開くとUTF-8のファイルが文字化けするけど「外部データの取り込み」でインポートすれば文字コードを指定できたような
Re: (スコア:0)
まあ要は元コメは、CSVをダブルクリックしたらEUCかJISかShiftJISかUnicodeかUTF-8か自動判定してくれればいいのに、って言いたいだけじゃね?
# UnicodeとUTF-8を別物扱いされるともやるのでAC
Re: (スコア:0)
UnicodeとUTF-8は別物です
#MSがUTF-16LEのことをUnicodeと称するのは止めにしてほしい
#文字コード関連の正しい知識を一般人に求められないのは当然だが、それでも、誤用を広めるのは害悪でしかない
Re: (スコア:0)
無能な奴ほど自分が無知だと疑わずに道具の文句を言う
Re: (スコア:0)
いや、ExcelはUTF-8対応してるが?
Excelが対応していないのはUTF-8N(BOMなしUTF-8)で、BOM付きのUTF-8なら対応している。
実際やってみれば文字化けせずにちゃんと読み込める。
タレコミにだって
このうちCSVファイルはBOMなしのUTF-8で保存され、エクセルで文字コード指定なしで開くと文字化けすることから、「文字化けしてる!」という声がネットで見られます。
と書いてある。
まぁ、UTF-8ではBOMに関しては許容するが推奨はしないという扱いのはずなので
BOM付きUTF-8という存在は微妙ではある。
Re: (スコア:0)
ZWNBSP (U+FEFF) がファイルの先頭に入っている UTF-8 の CSV (カンマ区切り) か、
BOM 付き UTF-16BE の CSV (タブ区切り) でどうぞ。
Re: (スコア:0)
「ZWNBSP (U+FEFF) がファイルの先頭に入っている UTF-8」とか書く癖に
「BOM 付き UTF-16BE」の方は気にしないのがモヤッとしますね。
Re: (スコア:0)
CSVは仕様と言える仕様がRFC 4180しかなくて、RFC 4180は実質US-ASCIIしか想定してない(※)し、
データ交換に使うにはあんまり向いてない。(RFC 4180も「こんな感じなら大体読めるんじゃないかなー」というレベル)
実際の仕様は各処理系の定義によって、Excelの定義では
「エンコードはUTF-16LEまたはANSI CPとする。ファイルの先頭がEF BB BFになっていればCP65001として解釈する」
になっていると思われる。
処理系はそれぞれ「俺の考えるCSVの仕様」を(明示的か暗黙的かは問わず)定義しているはずなので、
データ交換時に互換性がない処理系を結ぶなら当然それは整えてから渡してやらないといけない。
Re: (スコア:0)
オフトピですが
Microsoft Excelはダブルクオートを全く使わないのよとか書くなら
フィールド内(セル内)改行はLF使ってることも書いておいてくれればいいのに。