アカウント名:
パスワード:
だからさ、UnicodeでUTF-16でみんな幸せなんて幻想だったってことが、はっきりしたよね。マルチバイト文字の思想の方が合理性があったってことだよ。意味量の少ない文字は情報量も少なく、意味量の多い文字は情報量も多い。これがあるべき文字コードの姿だ。Twitterがやろうとしてることを真面目にやろうと思ったら、言語ごと、文字ごとに重さを定義して、総計が一定値を超えないように制限する感じになるよね。簡便のために、UTF-8で420バイトまでって制限にしちゃえばいいんじゃないか?
国旗絵文字(Regional Indicator Symbol)は8バイト必要だけどあれも情報量が多いって言えるのだろうか。単に後から入った文字はいい位置を貰えなかっただけって気がする。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
もうUTF-8でバイト数制限にしちゃえば? (スコア:0)
だからさ、UnicodeでUTF-16でみんな幸せなんて幻想だったってことが、はっきりしたよね。
マルチバイト文字の思想の方が合理性があったってことだよ。意味量の少ない文字は情報量も少なく、意味量の多い文字は情報量も多い。これがあるべき文字コードの姿だ。
Twitterがやろうとしてることを真面目にやろうと思ったら、言語ごと、文字ごとに重さを定義して、総計が一定値を超えないように制限する感じになるよね。
簡便のために、UTF-8で420バイトまでって制限にしちゃえばいいんじゃないか?
Re:もうUTF-8でバイト数制限にしちゃえば? (スコア:0)
国旗絵文字(Regional Indicator Symbol)は8バイト必要だけどあれも情報量が多いって言えるのだろうか。
単に後から入った文字はいい位置を貰えなかっただけって気がする。