アカウント名:
パスワード:
次はデフォルトの文字コードに手を付けてくれたまへ
Windowsの文字コードって複数あるの?
メモ帳のだぞデフォルトだとANSIになってる他にUnicode、Unicode big endian、UTF-8が使える
最近はHTMLやソースコード関連がUTF-8推奨なのでデフォルトをUTF-8に変えても良さそう
BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけどそれが無かったら判別のためにテキスト全文を読んで、どの文字コードだと解釈すれば矛盾が無いかを評価しなくてはならず非常に負荷が高いその上、本文が短い場合には複数の文字コードで矛盾が生じないケースもあって、自動判別が不可能な場合まである
複数のファイルを結合して問題が生じる?いや、BOMはファイルの先頭以外では無視しなければならない(幅0の空白文字)仕様なんだから不具合が生じる方がおかしい
そして、BOMのせいで動作しないアプリケーションはUnico
は?お前、符号化の仕組みを全く理解してないだろ。BOMに文字エンコーディングを判別する役割なんかねぇぞ。それにUTF-8はエンディアン関係ない。UTF-16等はエンディアンによってバイトオーダー変わるから必要ってだけだ。BOMは先頭以外で無視?バカか、バイトをCPUでなくBOMで指定されたエンディアンで処理しないといけないんだからんなわけないだろ。
みんなUTF-8の話をしていて理解してると思いますよUTF-8のBOMが「バイトオーダーマーク」でないのは事実ですがCRもLFも元々の意味と違いますよね?そもそも論がしたいならコメント付ける場所間違ってますよ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日々是ハック也 -- あるハードコアバイナリアン
いいぞ (スコア:0)
次はデフォルトの文字コードに手を付けてくれたまへ
Re: (スコア:0)
Windowsの文字コードって複数あるの?
Re: (スコア:0)
メモ帳のだぞ
デフォルトだとANSIになってる
他にUnicode、Unicode big endian、UTF-8が使える
最近はHTMLやソースコード関連がUTF-8推奨なので
デフォルトをUTF-8に変えても良さそう
Re: (スコア:5, すばらしい洞察)
BOM は重要 (スコア:1)
BOMは文字エンコーディングやエンディアンを確実に判別できるという重要な役割を果たしているわけなんだけど
それが無かったら判別のためにテキスト全文を読んで、どの文字コードだと解釈すれば矛盾が無いかを評価しなくてはならず
非常に負荷が高い
その上、本文が短い場合には複数の文字コードで矛盾が生じないケースもあって、自動判別が不可能な場合まである
複数のファイルを結合して問題が生じる?
いや、BOMはファイルの先頭以外では無視しなければならない(幅0の空白文字)仕様なんだから不具合が生じる方がおかしい
そして、BOMのせいで動作しないアプリケーションはUnico
Re: (スコア:0)
は?
お前、符号化の仕組みを全く理解してないだろ。
BOMに文字エンコーディングを判別する役割なんかねぇぞ。
それにUTF-8はエンディアン関係ない。
UTF-16等はエンディアンによってバイトオーダー変わるから必要ってだけだ。
BOMは先頭以外で無視?バカか、バイトをCPUでなくBOMで指定されたエンディアンで処理しないといけないんだからんなわけないだろ。
Re:BOM は重要 (スコア:0)
みんなUTF-8の話をしていて理解してると思いますよ
UTF-8のBOMが「バイトオーダーマーク」でないのは事実ですが
CRもLFも元々の意味と違いますよね?
そもそも論がしたいならコメント付ける場所間違ってますよ