アカウント名:
パスワード:
実社会、物理社会では「⼤」(U+2F24)も「大」も紙に書き下したときの形が同じなら同じ文字なのに、コンピューター用に符号化されると別の文字という扱いになる。コンピューター用の文字は、言語というコンテキストが付与された、現実世界の文字の上位互換の概念なのか。さんざん言われているけど、文字って奥が深いな。
漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
ならば日本語の漢字と中国語の漢字も同じ文字は同じコードで表そうと試み、普及しているのがUnicodeのCJK統合漢字。ただ、日本語の漢字と中国語の漢字で「同じ文字」って何?それは何かの客観的な基準に基づいて定義されたものなの?とは思う。中国語を知らないのでよくわからないけど。
形が同じだから同じ文字ってのはやや乱暴なのでは。
BMP (基本多言語面) に納めようとして失敗した Unicode の負の遺産だね。その辺りの解消がない限り、日常の日本語の文脈では JIS X 0208 の…当面の仮のコンテナでしかない。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日々是ハック也 -- あるハードコアバイナリアン
文字とは何なのか (スコア:0)
実社会、物理社会では「⼤」(U+2F24)も「大」も紙に書き下したときの形が同じなら同じ文字なのに、
コンピューター用に符号化されると別の文字という扱いになる。
コンピューター用の文字は、言語というコンテキストが付与された、現実世界の文字の上位互換の概念なのか。
さんざん言われているけど、文字って奥が深いな。
Re: (スコア:0)
漢数字の二とカタカナのニは形は同じだけど違う文字で、ひらがなのへとカタカナのヘもやっぱり違う文字。
英語とドイツ語には、エスツェットとかドイツ語にしか現れない文字もあるけど、たいていは「同じ文字」を使っている。
ならば日本語の漢字と中国語の漢字も同じ文字は同じコードで表そうと試み、普及しているのがUnicodeのCJK統合漢字。
ただ、日本語の漢字と中国語の漢字で「同じ文字」って何?それは何かの客観的な基準に基づいて定義されたものなの?とは思う。中国語を知らないのでよくわからないけど。
形が同じだから同じ文字ってのはやや乱暴なのでは。
Re:文字とは何なのか (スコア:0)
BMP (基本多言語面) に納めようとして失敗した Unicode の負の遺産だね。
その辺りの解消がない限り、日常の日本語の文脈では JIS X 0208 の…当面の仮のコンテナでしかない。