アカウント名:
パスワード:
サロゲートペアなんて対応してないソフトだって未だあるんだし、実用上はBMPだけでいいでしょ。そうしたら(英数字も含めて)2バイトですよ。(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。日本語が3バイトになるのは、単にUTF-8というエンコード方式によるもので。
(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。
それを「誤解を招きかねない言い方」で済ますのはいかがかと。それを言うのなら、そもそも Unicode 自体はバイト数と関連しません。よって、「Unicodeは実用上2バイト」も間違い。
Unicodeとバイト数は関係いない以上、『サロゲートペアや合成文字や異体字などを無視すれば、「Unicodeは実用上2バイト」で1文字を識別する情報を格納できる』と解釈する以外ないのでは?どのように解釈したのかきいてみたい。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー
Unicodeは実用上2バイト (スコア:1)
サロゲートペアなんて対応してないソフトだって未だあるんだし、実用上はBMPだけでいいでしょ。
そうしたら(英数字も含めて)2バイトですよ。
(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。
日本語が3バイトになるのは、単にUTF-8というエンコード方式によるもので。
Re: (スコア:0)
それを「誤解を招きかねない言い方」で済ますのはいかがかと。
それを言うのなら、そもそも Unicode 自体はバイト数と関連しません。
よって、「Unicodeは実用上2バイト」も間違い。
Re: (スコア:0)
Unicodeとバイト数は関係いない以上、
『サロゲートペアや合成文字や異体字などを無視すれば、「Unicodeは実用上2バイト」で1文字を識別する情報を格納できる』
と解釈する以外ないのでは?
どのように解釈したのかきいてみたい。
Re:Unicodeは実用上2バイト (スコア:0)