アカウント名:
パスワード:
なので、こっちは別にいいと思うんだけど。むしろ言語殺しとも言われる当用漢字の方が字源が分からなくなったりして問題。
いやー、文字コードが新字体・旧字体でいっしょというのはまずいでしょ。旧字体には旧字体自体のUnicodeが振られているんだから。下手すると、新字体・旧字体が入り混じったデータになっちゃうヨ。
検索性を考えると、文字コードは同じにしておいて異体字セレクタで区別すべきでは?
各プログラム言語でUnicodeの正規化の基準が違っておかしくなったり…してるじゃないか
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
繁体字≒旧字体 (スコア:0)
なので、こっちは別にいいと思うんだけど。
むしろ言語殺しとも言われる当用漢字の方が字源が分からなくなったりして問題。
Re: (スコア:0)
いやー、文字コードが新字体・旧字体でいっしょというのはまずいでしょ。旧字体には旧字体自体のUnicodeが振られているんだから。下手すると、新字体・旧字体が入り混じったデータになっちゃうヨ。
Re: (スコア:1)
検索性を考えると、文字コードは同じにしておいて異体字セレクタで区別すべきでは?
Re:繁体字≒旧字体 (スコア:0)
同一視して検索したいときは正規化してからgrepすればいいし
区別して検索したいときだってあるから区別できるようにしておく必要がある
何も考えずに文字コード一致だけで検索するプログラムとプログラマーがカスなだけ
どうせ大文字小文字やウムラウト・濁点半濁点とかの処理は必要なんだし
Re: (スコア:0)
各プログラム言語でUnicodeの正規化の基準が違っておかしくなったり…してるじゃないか