アカウント名:
パスワード:
日本にいるとUTF-8しか存在感がないんだけど、こんなもん本当に必要なのかな?
UTF-8は符号化文字集合としてのUnicodeをどう符号化、つまりどういったビット列にするか決めたもの。だから、UTF-16もUTF-8も、符号化文字集合としてのUnicodeは同じものを使ってる。このストーリで言っているUnicodeは符号化文字集合で、UTF-8とかUTF-16は文字符号化方式。
間違ってたら誰か突っ込んでくれ。
指摘としては正しいがユニコードが必要な理由の説明にはなっていない気も…絵文字は実装によって同じ符号でも別の絵になったりするので困る。まるでバベルの塔にいかった神が言葉を乱したかのようだ…
えっ?文字集合Unicodeのエンコーディング方法のひとつがUTF-8なんだから、UnicodeがなかったらUTF-8もないよ。
一応そういう規格だけど、もうUTF-8以外はobsolete状態なので、Unicode=UTF-8って認識でも問題なかろう。あとはUnicode ConsortiumがUTF-8以外を非推奨に変更するのも時間の問題かな。(UTF-7は既に非推奨)
情報交換形式としてはUTF-8に一本化されつつあるが内部表現ではUTF-16もUTF-32も使われ続けている訳だが。
Webしか知らないんでしょ生暖かい目で見てあげましょうよ
とはいえ、肝心のjsは内部的にはUTF-16ですしねぇ・・・。闇が深い。
UTF-7はUTF-16BEをBASE64でエンコードした変態仕様だから、他と同列には語れないよ。
国際化ドメイン名で使うPunycodeのことも忘れないでください。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」
Unicodeって何? (スコア:0)
日本にいるとUTF-8しか存在感がないんだけど、こんなもん本当に必要なのかな?
Re: (スコア:2, 参考になる)
UTF-8は符号化文字集合としてのUnicodeをどう符号化、つまりどういったビット列にするか決めたもの。
だから、UTF-16もUTF-8も、符号化文字集合としてのUnicodeは同じものを使ってる。
このストーリで言っているUnicodeは符号化文字集合で、UTF-8とかUTF-16は文字符号化方式。
間違ってたら誰か突っ込んでくれ。
Re: (スコア:0)
指摘としては正しいがユニコードが必要な理由の説明にはなっていない気も…
絵文字は実装によって同じ符号でも別の絵になったりするので困る。
まるでバベルの塔にいかった神が言葉を乱したかのようだ…
Re: (スコア:0)
えっ?
文字集合Unicodeのエンコーディング方法のひとつがUTF-8なんだから、
UnicodeがなかったらUTF-8もないよ。
Re:Unicodeって何? (スコア:0)
一応そういう規格だけど、もうUTF-8以外はobsolete状態なので、Unicode=UTF-8って認識でも問題なかろう。
あとはUnicode ConsortiumがUTF-8以外を非推奨に変更するのも時間の問題かな。(UTF-7は既に非推奨)
Re:Unicodeって何? (スコア:1)
情報交換形式としてはUTF-8に一本化されつつあるが
内部表現ではUTF-16もUTF-32も使われ続けている訳だが。
Re: (スコア:0)
Webしか知らないんでしょ
生暖かい目で見てあげましょうよ
Re: (スコア:0)
まあ UTF-8 が Web などの分野での標準であることは異論無いが。
-- To be sincere...
Re: (スコア:0)
とはいえ、肝心のjsは内部的にはUTF-16ですしねぇ・・・。
闇が深い。
Re: (スコア:0)
UTF-7はUTF-16BEをBASE64でエンコードした変態仕様だから、他と同列には語れないよ。
Re: (スコア:0)
国際化ドメイン名で使うPunycodeのことも忘れないでください。