Re:Unicodeは実用上２バイト (#2665853) | ゼンリンが国内主要都市の3Dモデルデータを提供へ | スラド

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

「ゼンリンが国内主要都市の3Dモデルデータを提供へ」記事へのコメント

記事ページを表示すべてのコメント取得

検索33コメント Log In/Create an Account

Unicodeは実用上２バイト (スコア:1)

by nim (10479)

サロゲートペアなんて対応してないソフトだって未だあるんだし、実用上はBMPだけでいいでしょ。
そうしたら（英数字も含めて）2バイトですよ。
（あえて誤解を招きかねない言い方をすると）Unicode に 3 バイトの文字はありません。
日本語が3バイトになるのは、単にUTF-8というエンコード方式によるもので。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  テキスト系のプログラミングをやってる人はわかると思うけど、ユニコードをUTF-8やUTF-16でエンコードするのは、環境の問題なので、普通は4バイトの配列にする。つまり、UCS-4が一番ナチュラルだし、unicode.orgでもそうやってインデックスを付けている。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    >普通は4バイトの配列にする
    普通ってどこの普通だよ。内部エンコーディングでもUTF-16かUTF-8が大半で、32bitで持つシステムが少数派でしょ。Pythonくらいか。
    - Re:Unicodeは実用上２バイト (スコア:0)
      
      by Anonymous Coward on 2014年08月28日 23時22分 (#2665853)
      
      wchar_t は 4 バイトが普通ですよ。
      UTF-8 が主流なのは情報交換用。
      
      シェア
      
      親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

アレゲは一日にしてならず -- アレゲ研究家