アカウント名:
パスワード:
UTF-8は符号化方法なので、もともとの文字コード表の仕様とちゃんと合うようにさえ選ばれていたら、足りなくなることはないはずです。
そして、もともとの文字コード表については既に16bitじゃ足りなくなっていて1996年のUnicode 2.0で拡張されています。その規格は、一番最初の面を0面として、さらに追加で16面用意され、計17面用意されています。
この中途半端な拡張は、UTF-8よりむしろUTF-16の都合によるもので、UTF-16でどうにか他の面の文字を参照する仕組みであるサロゲートペアが1024個の文字2つ=20bit=16bit*(2^4面)を利用するため、そういう制限になっています。
UTF-8は、現行規格では有効な文字コードは第16面までと制限されていますが、その制限を取っ払えば、今と同じ方法で31bitまで表現できます。
いくらなんでも言掛かりあなたは自分の知識を疑った方がよいと思う
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
誤読した (スコア:-1, オフトピック)
もうちょっといい見出しつけてよ
UTF-8の利用率が50%を越えたとか
Re:誤読した (スコア:1)
UTF-8は符号化方法なので、もともとの文字コード表の仕様とちゃんと合うようにさえ選ばれていたら、足りなくなることはないはずです。
そして、もともとの文字コード表については既に16bitじゃ足りなくなっていて1996年のUnicode 2.0で拡張されています。
その規格は、一番最初の面を0面として、さらに追加で16面用意され、計17面用意されています。
この中途半端な拡張は、UTF-8よりむしろUTF-16の都合によるもので、UTF-16でどうにか他の面の文字を参照する仕組みであるサロゲートペアが1024個の文字2つ=20bit=16bit*(2^4面)を利用するため、そういう制限になっています。
UTF-8は、現行規格では有効な文字コードは第16面までと制限されていますが、その制限を取っ払えば、今と同じ方法で31bitまで表現できます。
1を聞いて0を知れ!
Re: (スコア:0)
いくらなんでも言掛かり
あなたは自分の知識を疑った方がよいと思う