アカウント名:
パスワード:
サロゲートペアなんて対応してないソフトだって未だあるんだし、実用上はBMPだけでいいでしょ。そうしたら(英数字も含めて)2バイトですよ。(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。日本語が3バイトになるのは、単にUTF-8というエンコード方式によるもので。
(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。
それを「誤解を招きかねない言い方」で済ますのはいかがかと。それを言うのなら、そもそも Unicode 自体はバイト数と関連しません。よって、「Unicodeは実用上2バイト」も間違い。
Unicodeとバイト数は関係いない以上、『サロゲートペアや合成文字や異体字などを無視すれば、「Unicodeは実用上2バイト」で1文字を識別する情報を格納できる』と解釈する以外ないのでは?どのように解釈したのかきいてみたい。
元々の理念だった2オクテット固定長で扱いやすいUTF-16が真っ先に思い浮かんだのでは?
いや、それは UTF-16 でなく UCS-2。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
Unicodeは実用上2バイト (スコア:1)
サロゲートペアなんて対応してないソフトだって未だあるんだし、実用上はBMPだけでいいでしょ。
そうしたら(英数字も含めて)2バイトですよ。
(あえて誤解を招きかねない言い方をすると)Unicode に 3 バイトの文字はありません。
日本語が3バイトになるのは、単にUTF-8というエンコード方式によるもので。
Re: (スコア:0)
それを「誤解を招きかねない言い方」で済ますのはいかがかと。
それを言うのなら、そもそも Unicode 自体はバイト数と関連しません。
よって、「Unicodeは実用上2バイト」も間違い。
Re: (スコア:0)
Unicodeとバイト数は関係いない以上、
『サロゲートペアや合成文字や異体字などを無視すれば、「Unicodeは実用上2バイト」で1文字を識別する情報を格納できる』
と解釈する以外ないのでは?
どのように解釈したのかきいてみたい。
Re: (スコア:0)
元々の理念だった2オクテット固定長で扱いやすいUTF-16が真っ先に思い浮かんだのでは?
Re:Unicodeは実用上2バイト (スコア:0)
いや、それは UTF-16 でなく UCS-2。