アカウント名:
パスワード:
なので、こっちは別にいいと思うんだけど。むしろ言語殺しとも言われる当用漢字の方が字源が分からなくなったりして問題。
いやー、文字コードが新字体・旧字体でいっしょというのはまずいでしょ。旧字体には旧字体自体のUnicodeが振られているんだから。下手すると、新字体・旧字体が入り混じったデータになっちゃうヨ。
検索性を考えると、文字コードは同じにしておいて異体字セレクタで区別すべきでは?
異体字セレクタを考慮して検索するエディタとかあるのだろうか。
各プログラム言語でUnicodeの正規化の基準が違っておかしくなったり…してるじゃないか
主に中国の反対で実現していない。中国は自国に必要な文字はちゃんと統合漢字として収録させている
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー
繁体字≒旧字体 (スコア:0)
なので、こっちは別にいいと思うんだけど。
むしろ言語殺しとも言われる当用漢字の方が字源が分からなくなったりして問題。
Re:繁体字≒旧字体 (スコア:0)
いやー、文字コードが新字体・旧字体でいっしょというのはまずいでしょ。旧字体には旧字体自体のUnicodeが振られているんだから。下手すると、新字体・旧字体が入り混じったデータになっちゃうヨ。
Re:繁体字≒旧字体 (スコア:1)
検索性を考えると、文字コードは同じにしておいて異体字セレクタで区別すべきでは?
Re: (スコア:0)
異体字セレクタを考慮して検索するエディタとかあるのだろうか。
Re: (スコア:0)
同一視して検索したいときは正規化してからgrepすればいいし
区別して検索したいときだってあるから区別できるようにしておく必要がある
何も考えずに文字コード一致だけで検索するプログラムとプログラマーがカスなだけ
どうせ大文字小文字やウムラウト・濁点半濁点とかの処理は必要なんだし
Re: (スコア:0)
各プログラム言語でUnicodeの正規化の基準が違っておかしくなったり…してるじゃないか
Re: (スコア:0)
主に中国の反対で実現していない。中国は自国に必要な文字はちゃんと統合漢字として収録させている