パスワードを忘れた? アカウント作成
13893660 story
インターネット

WebサイトやWebサービスで異体字セレクタは使われているか 59

ストーリー by hylom
最悪Webフォントか画像で済ます 部門より
あるAnonymous Coward曰く、

最近、令和の「令」の下を「マ」の字体にしたいという需要があるとして、異体字セレクタが注目を集めた(スラドのコメント経済産業省のFAQ)。

Windows標準の日本語フォントでは「令」の下が「マ」になっている異体字が収録されているフォントはないが、「UDデジタル 教科書体」なら異体字に関係なく「マ」になっている。そのため令和に関して異体字セレクタを使用するケースはあまりなさそうだ。

現時点でほかに異体字セレクタが活用できそうな例がないかと探したところ、1つだけ見つけたので紹介したい。ニコニコチャンネルで配信されているアニメ「鬼滅の刃」のキャスト表に、「竈門禰豆子」というヒロインのキャラクター名が書かれている。そして、キャスト表の下部には『※禰豆子の「禰」は「ネ+爾」が正式表記』と書かれている。

これは一般的なフォントには収録されていない書体なのかとアニメ公式サイトのキャスト表を見てみると、テキストで「ネ+爾」となっている。どのように実現しているのか確認したところ、"f_neduko"というclassを定義し、「禰」にCSSで「font-family: "Noto Serif TC"、serif;」と指定されていた。Noto Serif TCは明朝体に相当する繁体字中国語のようで(中国語のみ指定している明朝体フォントがあたらない場合の対処法Googleが提供している中国語のWebフォントを使う方法)、これをWebフォントとして使用することにより「ネ+爾」の表示を実現している。

日本語における「示+爾」と「ネ+爾」の関係は、JIS2004の例示字形変更で「ネ」から「示」へ変更になったそうだ(「禰」の書き方)。古いフォントを確認したところ、実際に「ネ」で収録されていた。

さて、ここからやっと「ネ+爾」に関する異体字セレクタの話である。異体字セレクタセレクタで「禰」の[登録済みの異体字を検索]すると、コードU+79B0・セレクタU+E0100などがヒットする。さて、「禰」(U+79B0 U+E0100)はあなたの環境で「ネ+爾」と表示されているだろうか。といきたいところだが、残念ながらスラドのシステムではプレビューを行うと異体字セレクタが削除されてしまうようだ。ローカル環境で試すなら、Windows 10 1809標準のすべての日本語フォント(MS ゴシック/明朝、メイリオ、游ゴシック/明朝、UDデジタル 教科書体、BIZ UD)が対応している。

今回のケースでは公式サイトなどで異体字セレクタは使用されていなかった。システムの制限などによって、説明文を付与する方式が使われたり、フォントを指定すること(例えばWikipediaのTemplate:JIS90フォント)もあるだろう。Google検索では異体字セレクタの有無によって検索結果に違いはなかった。今後、一般向けのウェブサイトやウェブサービスで異体字セレクタは広く使われるようになるのだろうか。

  • これからは過去の文学作品と歴史的資料に関する記載だけに使用可ということしては駄目なのかな。
    ここに返信
    • by Anonymous Coward

      コンピュータで打ち出した字体が本当の自分の名前と違うとか
      ぐだぐだいうやつは、漢字の歴史を勉強した上で、それでも
      文句があるなら自分で手書きしたものだけ読んでろというのが
      率直な感想。

    • by Anonymous Coward

      過去の文学作品と歴史的資料を電子化するのに異字体は使い続けることになるんですよ。
      処理可能な文字はできるだけ多くあるべきです。

      新しく書く方にかんしては、常用漢字というものが昔からある。

      • 過去の文献の電子化の件については異議はなく、異体字、旧字体、俗字等々を表示するシステムが必要である事は理解していますが、異体字は新たに使って欲しくないな・・・という事です。
        はしご高のような人名用漢字が典型例でしょうか。
        なお、常用漢字という縛りはあまりに好きではありません。何が悲しくて使う漢字を制限されなくてはならないのかと・・・。
        常用漢字のみを使用することが原則なので、常用漢字外の字は、その字のみ平仮名書きするという運用を見ると悲しくなってきます。
        # ・・・それとも、私、異体字と常用漢字の定義を間違っているのかな。
        • by Anonymous Coward

          常用漢字外は読めなくても公共サービスを受けるのに不都合がないことに
          なっているんです。常用漢字外を使うというのは一部の人しか相手にしな
          いという意思表示になります。そうでないならルビを使いましょう。

          話がそれましたが、常用漢字を持ち出したのは、多くの人に読みやすいような
          制限をかける方向はすでにありますよという話でした。字形とははあまり関係
          ありませんでしたね。

          しかしなぜ異体字を使ってほしくないんですか?
          読み手を選ぶのは問題ないと考えているんですよね。
          (ねんのために言うと、プロじゃなきゃそれでも全然問題ないですよ)
          ほかの人からあなたが選ばれなくても問題ないじゃないですか。
          何が悲しくて使う漢字を制限されなくてはならないのかと。

          • 異体字というのは「形は違うが同じ漢字」というものだと考えています。(ここが間違っていなけばいいのですが・・・)
            同じ漢字なのだから、芸術等のように形に意味を持たせる場合以外では区別する必要はなく、データセットとして区別する必然性はないと思っています。例えば、フォントで設定するでも十分ではないのでしょうか。
            常用漢字については、当初のコメントでは字形と同一視される書き方をされていたので、それは違うという意見を表明したのみです。
            最後に、なぜ、異体字使用に疑問を持つかというと、人名用漢字の存在が大きいですね。
            人の管理をすると、異体字の所為のトラブルが多いと感じていまう。些細なものではありますが意味の無い違いが原因となれば、忌避したくはなります。

            ま、何か強い信念がある訳でもなく、強い嫌悪がある訳でもありませんので、そんなに意見はおかしいと言われれば、そうかなとも思います。
            • 例えば、フォントで設定するでも十分ではないのでしょうか。

              どう言う意味?
              異体字セレクタとは違う話?

              些細なものではありますが意味の無い違いが原因となれば、忌避したくはなります。

              人名に関して言えば、些細かどうかは、本人が決めることであって、他人がとやかく言うもんでもないでしょう。
              常用漢字という制限が嫌だ、という人が、他人様の人名に今以上の制限を書けて良い、と考える根拠が理解できないです。

              もっとも、人名と雖も社会的な制限を受けるというのはその通りで、
              例えば人名漢字が決められてたり、
              外国人の漢字の人名をどう読むか、
              みたいなことが本人の意思とは別に決められてたりします。

              あと、結婚したらどちらかの姓が変わるとか、
              姓・名の二つで一つの人名を為すとか、
              改名の自由が強く制限されているとか、そう言うこともあったりはしますね。
              今後変わっていくかもしれませんけど。

              • どう言う意味? 異体字セレクタとは違う話?

                こんな意味かな [it.srad.jp]

                人名に関して言えば、些細かどうかは、本人が決めることであって、他人がとやかく言うもんでもないでしょう。 常用漢字という制限が嫌だ、という人が、他人様の人名に今以上の制限を書けて良い、と考える根拠が理解できないです。

                まあ、確かに他人がとやかくいう話ではなく、戸籍法施行規則第60条に基づき国が人名用漢字を告示して決めるものですね。
                (要望を考慮して削除されたり追加されたりしている時もあるので、他人がとやかくいう事で決まっているとも言えるのかも。)
                ただ、名前の異体字に意味を見出すかはその人の考えというのは指摘の通りで、私の意見は傲慢なのでしょう。
                前提提自体が間違っているというコメントも頂きましたので、このあたりで退場させていただきます。

            • by Anonymous Coward

              音読みが複数あるのは混乱の元だから統一しようぐらいには間違っているかと。

    • by Anonymous Coward

      大丈夫。この世界はIVSが使われないほうのワールドだから。

  • by Anonymous Coward on 2019年04月23日 18時29分 (#3604237)

    冒頭からすごい違和感。

    > 最近、令和の「令」の下を「マ」の字体にしたいという需要があるとして、

    それどこ情報?リンクされてる先ではそんな話はしてないと思うけど、

    と言うか、逆じゃない?
    「マ」の字体は楷書体、そうではない方は明朝体なんだけど、
    官房長官が記者会見で発表したものが明朝体っぽく書かれていたから、
    楷書体でも明朝体っぽく「マ」じゃない方で表示させたい、と言う需要だよね?

    で、フォント屋はその需要に対応しつつあるみたい。
    https://www.mdn.co.jp/di/newstopics/65278/ [mdn.co.jp]

    話の導入部と、主旨が噛み合ってないように思えるよ。

    ここに返信
  • by Anonymous Coward on 2019年04月23日 18時52分 (#3604264)

    痛い字セレクタ

    ここに返信
  • by Anonymous Coward on 2019年04月23日 20時47分 (#3604388)

    文字とコンピュータの話をしてるとyasuokaが来るぞ

    ここに返信
    • by nnnhhh (47970) on 2019年04月24日 2時25分 (#3604570) 日記

      あの知識量ほんとすごい
      でもあまりコメントして下さらなくて残念

  • by Anonymous Coward on 2019年04月23日 18時20分 (#3604233)

    ネ+爾になる

    辻も一点之繞だし、JIS X 0213:2004が反映されてないみたい

    字形比較できる参考サイト
    https://sunpillar2018.onmitsu.jp/Japanese.html#a14 [onmitsu.jp]

    ここに返信
    • by Ponta2 (47202) on 2019年04月23日 20時03分 (#3604347)
      なんないです。
      てゆうかベンダー・端末ごとにインストールされている日本語フォント違ったりするので「Androidだと」という話はしにくい。
      Google謹製の「Noto * JP」では示+爾になってます。
    • by Anonymous Coward

      Unicodeの文字表だけ見て普通に作ったらそうなるよな。CJK互換漢字のJ欄にはJIS2004の改正はとくに反映されていないので。

    • by Anonymous Coward

      単に中華フォントになっているだけではなくて?

      • by Anonymous Coward

        SHARPのSH-01Kで確認すると、Noto Sans CJK JPは新JISの字体、それ以外のモリサワ 新ゴ、LC明朝、SHクリスタルタッチは旧JISの字体になった

        ちなみにシステムデフォルトはモリサワ 新ゴ

        中華といえばそうかも

        • by Anonymous Coward

          Noto Sans CJK JPも異体字セレクターで旧JISの字体を普通に出せるんだな。わざわざ台湾のフォントなんか指定しなくてもこれでいいのに。

  • by Anonymous Coward on 2019年04月23日 18時34分 (#3604244)

    とにかくめんどくさいわけね。

    ここに返信
    • by Anonymous Coward

      従わないやつを粛清できるのが日本との違いだろ。当用漢字時代は日本でもそれなりに徹底していた気がするが(長嶋茂雄も長島茂雄と表記されていたとか)

      • 長島さんは山鳥の島を使わなくなったけど、
        今でも人名に山鳥の嶋を使う人はたくさんいるでしょ?
        プロ野球選手の嶋基宏とか。
        少なくとも山鳥の嶋に関しては、「それなりに徹底」はしてない印象なんだけど。

        • by Anonymous Coward

          いや、当用漢字時代は新聞報道でも長島と表記されていたけど、今では(というかずいぶん前から)長嶋と表記するようになった(統制が緩んだ)って話。統制が緩んだんだから今でも使われているのは当然

          • by Anonymous Coward
            だからそれは順番が逆で、
            新聞社から派遣されてきた国語審議会の委員が当用漢字を制定したの。
            何か政府に規制されて長島に矯正されたんじゃなくって、新聞社の利益のために活字のコストを節約すために長島への改名を強制した(その大義名分として政府を利用した)わけ。
            写植とかPCとかが普及して長嶋って書いてもコスト変わらなくなったから止めただけ。
    • by Anonymous Coward

      あれはあれで、簡略化の過程で複数の文字が形が同じになった結果として文字が統合されて意味合いが分かりづらくなるという罠もある。

      • by Anonymous Coward

        そもそも漢字を表音化するのが当初の最終目標だったのでそれは意図的なのでは。北京官話の発音が同じなら方言では区別される文字でも平気で統合してるとか

    • by Anonymous Coward

      國鐵廣島 って書いてみろよ

  • by Anonymous Coward on 2019年04月23日 19時01分 (#3604279)

    Twitterは、検索できない?ツイートできない?ツイートされていない?
    禰豆子の検索結果はありません https://twitter.com/search?f=tweets&vertical=default&q=%E7%A6%... [twitter.com]

    ここに返信
  • by Anonymous Coward on 2019年04月23日 19時02分 (#3604281)

    正規化しろって安易に言うけど、何も考えずに正規化するとJIS X 0213で追加された人名用漢字の一部が化けるんだがそっちはいいのか?

    ここに返信
    • by Anonymous Coward

      人名用漢字を考慮した正規化ルールを標準化すれば良いのです

  • by Anonymous Coward on 2019年04月23日 19時27分 (#3604306)

    以前声優の「朴璐美」さんの璐の字(王ヘンに路)が使用したいフォントになくて画像として作ったのですが(ポスターでした)スラドでは璐は書けるのかな?

    ここに返信
  • by Anonymous Coward on 2019年04月23日 20時20分 (#3604363)

    Unicode は過去の雑多な文字コードとのラウンドトリップ互換性を維持したせいで、異体字の扱い自体の基準がバラバラで、異体字セレクタが使い難い。

    「器」の字体の問題とか。
    「高」とかもでも、伝統的に正しいやり方、明朝体や教科書体なら「くち高」、楷書や篆書なら「はしご高」になるような文字の指定はできない。

    結局フォントを意識しなければいけないなら、最初からフォントだけで指定した方が早い。

    ここに返信
  • by Anonymous Coward on 2019年04月24日 10時56分 (#3604741)

    絵文字の色変更機能が現在最も使われてるIVSだと思います。(個人の感想です。)

    ここに返信
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...