WebサイトやWebサービスで異体字セレクタは使われているか 59
最悪Webフォントか画像で済ます 部門より
最近、令和の「令」の下を「マ」の字体にしたいという需要があるとして、異体字セレクタが注目を集めた(スラドのコメント、経済産業省のFAQ)。
Windows標準の日本語フォントでは「令」の下が「マ」になっている異体字が収録されているフォントはないが、「UDデジタル 教科書体」なら異体字に関係なく「マ」になっている。そのため令和に関して異体字セレクタを使用するケースはあまりなさそうだ。
現時点でほかに異体字セレクタが活用できそうな例がないかと探したところ、1つだけ見つけたので紹介したい。ニコニコチャンネルで配信されているアニメ「鬼滅の刃」のキャスト表に、「竈門禰豆子」というヒロインのキャラクター名が書かれている。そして、キャスト表の下部には『※禰豆子の「禰」は「ネ+爾」が正式表記』と書かれている。
これは一般的なフォントには収録されていない書体なのかとアニメ公式サイトのキャスト表を見てみると、テキストで「ネ+爾」となっている。どのように実現しているのか確認したところ、"f_neduko"というclassを定義し、「禰」にCSSで「font-family: "Noto Serif TC"、serif;」と指定されていた。Noto Serif TCは明朝体に相当する繁体字中国語のようで(中国語のみ指定している明朝体フォントがあたらない場合の対処法、Googleが提供している中国語のWebフォントを使う方法)、これをWebフォントとして使用することにより「ネ+爾」の表示を実現している。
日本語における「示+爾」と「ネ+爾」の関係は、JIS2004の例示字形変更で「ネ」から「示」へ変更になったそうだ(「禰」の書き方)。古いフォントを確認したところ、実際に「ネ」で収録されていた。
さて、ここからやっと「ネ+爾」に関する異体字セレクタの話である。異体字セレクタセレクタで「禰」の[登録済みの異体字を検索]すると、コードU+79B0・セレクタU+E0100などがヒットする。さて、「禰」(U+79B0 U+E0100)はあなたの環境で「ネ+爾」と表示されているだろうか。といきたいところだが、残念ながらスラドのシステムではプレビューを行うと異体字セレクタが削除されてしまうようだ。ローカル環境で試すなら、Windows 10 1809標準のすべての日本語フォント(MS ゴシック/明朝、メイリオ、游ゴシック/明朝、UDデジタル 教科書体、BIZ UD)が対応している。
今回のケースでは公式サイトなどで異体字セレクタは使用されていなかった。システムの制限などによって、説明文を付与する方式が使われたり、フォントを指定すること(例えばWikipediaのTemplate:JIS90フォント)もあるだろう。Google検索では異体字セレクタの有無によって検索結果に違いはなかった。今後、一般向けのウェブサイトやウェブサービスで異体字セレクタは広く使われるようになるのだろうか。
異体字は使わなくなって欲しいな (スコア:2)
Re: (スコア:0)
コンピュータで打ち出した字体が本当の自分の名前と違うとか
ぐだぐだいうやつは、漢字の歴史を勉強した上で、それでも
文句があるなら自分で手書きしたものだけ読んでろというのが
率直な感想。
Re: (スコア:0)
どんな歴史があろうと形状の違う字は違う字だよ。
歴史的な文脈では違う字を同じ字とみなすことがあるというだけ。
歴史的な話をしたらUとVだって同じ字だ。
今さら文字コードポイントを多少節約したところで混乱が増すだけ。
Re:異体字は使わなくなって欲しいな (スコア:3)
旧人類とか、コードポイントの節約とかそういう話じゃない。
電子文書について、見た目を尊ぶ人と、情報の中身を尊ぶ人がいる。
前者はいわゆる「神エクセル」を崇拝し、見た目のために半角全角混ぜこぜの空白・数字・カタカナを駆使した文書を作る。
後者は逆。同じ意味の文字が複数種あると表記ゆれの原因になるので、極力減らすべきだと考える。
Re:異体字は使わなくなって欲しいな (スコア:1)
両方あっていいんじゃない?
リソースが無いわけじゃないんだから。
表記のゆれが気になるなら、ゆれない様に工夫すればいいだけじゃない。
そう言う入力アシストとか、lint的なものを使うとかさ。
そう言う情報を扱いたい人はそうすればいい。
私も仕事では文書にはそういうものを求めるしね。
一方、違う文字を区別して書きたいという要求もあるわけさ。
もしかしたら、ゆれを表現したいという人も居るかもしれないわけだし。
Re: (スコア:0)
だから、両方に対応するために異体字セレクタがあるんじゃないの?
Re:異体字は使わなくなって欲しいな (スコア:1)
もちろんそうだね。コードポイントの節約の話でもない。
ならば、違うと思う者は、違いを表現できるようコードポイントを使えばいいし、
そうでないなら、それなりに表現すればいい。
そういうことだよね。
ならば、いわゆる「神エクセル」を崇拝し、見た目のために半角全角混ぜこぜの空白・数字・カタカナを駆使した文書を作る [srad.jp]みたいな話と一緒にできるものではないよね。
Re: (スコア:0)
>リソースが無いわけじゃないんだから。
くだらない事に使うリソースは、ないなぁ
Re:異体字は使わなくなって欲しいな (スコア:1)
賛成はしないけど、一理あるね。
日本語なんてくだらないものに使うリソースはねぇよ、なんて言われて、日本語版が出なかったりしてるしね。
キミもくだらないことにリソース割いてないで、slashdot.orgへ行った方がいいじゃない?
Re: (スコア:0)
え?このコメントはくだらなくないの!?
Re: (スコア:0)
とか言いながら全角大なり記号という無意味にリソースを消費する記号を使う奴
# というギャグなのか
Re:異体字は使わなくなって欲しいな (スコア:1)
">"は">"すなわち">"よりもキー入力時の文字数が少ない点を思い起こされたし。
Re: (スコア:0)
けど、'Halfwidth and Fullwidth Forms' の文字は入力不可にしてほしい。
Re: (スコア:0)
過去の文学作品と歴史的資料を電子化するのに異字体は使い続けることになるんですよ。
処理可能な文字はできるだけ多くあるべきです。
新しく書く方にかんしては、常用漢字というものが昔からある。
Re:異体字は使わなくなって欲しいな (スコア:2)
はしご高のような人名用漢字が典型例でしょうか。
なお、常用漢字という縛りはあまりに好きではありません。何が悲しくて使う漢字を制限されなくてはならないのかと・・・。
常用漢字のみを使用することが原則なので、常用漢字外の字は、その字のみ平仮名書きするという運用を見ると悲しくなってきます。
# ・・・それとも、私、異体字と常用漢字の定義を間違っているのかな。
Re: (スコア:0)
常用漢字外は読めなくても公共サービスを受けるのに不都合がないことに
なっているんです。常用漢字外を使うというのは一部の人しか相手にしな
いという意思表示になります。そうでないならルビを使いましょう。
話がそれましたが、常用漢字を持ち出したのは、多くの人に読みやすいような
制限をかける方向はすでにありますよという話でした。字形とははあまり関係
ありませんでしたね。
しかしなぜ異体字を使ってほしくないんですか?
読み手を選ぶのは問題ないと考えているんですよね。
(ねんのために言うと、プロじゃなきゃそれでも全然問題ないですよ)
ほかの人からあなたが選ばれなくても問題ないじゃないですか。
何が悲しくて使う漢字を制限されなくてはならないのかと。
Re:異体字は使わなくなって欲しいな (スコア:2)
同じ漢字なのだから、芸術等のように形に意味を持たせる場合以外では区別する必要はなく、データセットとして区別する必然性はないと思っています。例えば、フォントで設定するでも十分ではないのでしょうか。
常用漢字については、当初のコメントでは字形と同一視される書き方をされていたので、それは違うという意見を表明したのみです。
最後に、なぜ、異体字使用に疑問を持つかというと、人名用漢字の存在が大きいですね。
人の管理をすると、異体字の所為のトラブルが多いと感じていまう。些細なものではありますが意味の無い違いが原因となれば、忌避したくはなります。
ま、何か強い信念がある訳でもなく、強い嫌悪がある訳でもありませんので、そんなに意見はおかしいと言われれば、そうかなとも思います。
Re:異体字は使わなくなって欲しいな (スコア:1)
例えば、フォントで設定するでも十分ではないのでしょうか。
どう言う意味?
異体字セレクタとは違う話?
些細なものではありますが意味の無い違いが原因となれば、忌避したくはなります。
人名に関して言えば、些細かどうかは、本人が決めることであって、他人がとやかく言うもんでもないでしょう。
常用漢字という制限が嫌だ、という人が、他人様の人名に今以上の制限を書けて良い、と考える根拠が理解できないです。
もっとも、人名と雖も社会的な制限を受けるというのはその通りで、
例えば人名漢字が決められてたり、
外国人の漢字の人名をどう読むか、
みたいなことが本人の意思とは別に決められてたりします。
あと、結婚したらどちらかの姓が変わるとか、
姓・名の二つで一つの人名を為すとか、
改名の自由が強く制限されているとか、そう言うこともあったりはしますね。
今後変わっていくかもしれませんけど。
Re:異体字は使わなくなって欲しいな (スコア:2)
どう言う意味? 異体字セレクタとは違う話?
こんな意味かな [it.srad.jp]
人名に関して言えば、些細かどうかは、本人が決めることであって、他人がとやかく言うもんでもないでしょう。 常用漢字という制限が嫌だ、という人が、他人様の人名に今以上の制限を書けて良い、と考える根拠が理解できないです。
まあ、確かに他人がとやかくいう話ではなく、戸籍法施行規則第60条に基づき国が人名用漢字を告示して決めるものですね。
(要望を考慮して削除されたり追加されたりしている時もあるので、他人がとやかくいう事で決まっているとも言えるのかも。)
ただ、名前の異体字に意味を見出すかはその人の考えというのは指摘の通りで、私の意見は傲慢なのでしょう。
前提提自体が間違っているというコメントも頂きましたので、このあたりで退場させていただきます。
Re: (スコア:0)
音読みが複数あるのは混乱の元だから統一しようぐらいには間違っているかと。
Re: (スコア:0)
大丈夫。この世界はIVSが使われないほうのワールドだから。
導入部に事実誤認が見られる気がしますよ。 (スコア:1)
冒頭からすごい違和感。
> 最近、令和の「令」の下を「マ」の字体にしたいという需要があるとして、
それどこ情報?リンクされてる先ではそんな話はしてないと思うけど、
と言うか、逆じゃない?
「マ」の字体は楷書体、そうではない方は明朝体なんだけど、
官房長官が記者会見で発表したものが明朝体っぽく書かれていたから、
楷書体でも明朝体っぽく「マ」じゃない方で表示させたい、と言う需要だよね?
で、フォント屋はその需要に対応しつつあるみたい。
https://www.mdn.co.jp/di/newstopics/65278/ [mdn.co.jp]
話の導入部と、主旨が噛み合ってないように思えるよ。
Re:導入部に事実誤認が見られる気がしますよ。 (スコア:1)
そもそも、異字体なのかという疑問があるんだが…。
楷書と行書と草書で書体が異なるのは異字体なのか? という。
それはフォントの違いに過ぎないのではなかろうか。
Re: (スコア:0)
楷書体と明朝体って
対比の対象なの?????
わざわざ一般的でない字体を選ぶ (スコア:1)
痛い字セレクタ
そろそろ (スコア:1)
文字とコンピュータの話をしてるとyasuokaが来るぞ
Re:そろそろ (スコア:2)
あの知識量ほんとすごい
でもあまりコメントして下さらなくて残念
Re:そろそろ (スコア:1)
スラドに文字トピックがちゃんと新設されれば良いのにといつも思う。
Re: (スコア:0)
あの人普通(以上)の人が普通の知識で普通に語ってると
「違う!全然違う!」「これくらいは知っとけ!」「仕様書や論文に書いてあるから知ってて当然だ!」「間違った事を言うな!」みたいなノリで晒されるのよね。
そもそも発信してくれる人が少ないのに下手すると委縮しちゃう。
知識量は圧倒的に凄いとは思うが、世の中の99.4%の人間は研究者ではない事を理解した方が良いと思う。
禰はAndroidだと (スコア:0)
ネ+爾になる
辻も一点之繞だし、JIS X 0213:2004が反映されてないみたい
字形比較できる参考サイト
https://sunpillar2018.onmitsu.jp/Japanese.html#a14 [onmitsu.jp]
Re:禰はAndroidだと (スコア:2)
てゆうかベンダー・端末ごとにインストールされている日本語フォント違ったりするので「Androidだと」という話はしにくい。
Google謹製の「Noto * JP」では示+爾になってます。
Re: (スコア:0)
Unicodeの文字表だけ見て普通に作ったらそうなるよな。CJK互換漢字のJ欄にはJIS2004の改正はとくに反映されていないので。
Re: (スコア:0)
単に中華フォントになっているだけではなくて?
Re: (スコア:0)
SHARPのSH-01Kで確認すると、Noto Sans CJK JPは新JISの字体、それ以外のモリサワ 新ゴ、LC明朝、SHクリスタルタッチは旧JISの字体になった
ちなみにシステムデフォルトはモリサワ 新ゴ
中華といえばそうかも
Re: (スコア:0)
Noto Sans CJK JPも異体字セレクターで旧JISの字体を普通に出せるんだな。わざわざ台湾のフォントなんか指定しなくてもこれでいいのに。
中国が簡体字にした理由がわかった (スコア:0)
とにかくめんどくさいわけね。
Re: (スコア:0)
従わないやつを粛清できるのが日本との違いだろ。当用漢字時代は日本でもそれなりに徹底していた気がするが(長嶋茂雄も長島茂雄と表記されていたとか)
Re:中国が簡体字にした理由がわかった (スコア:1)
長島さんは山鳥の島を使わなくなったけど、
今でも人名に山鳥の嶋を使う人はたくさんいるでしょ?
プロ野球選手の嶋基宏とか。
少なくとも山鳥の嶋に関しては、「それなりに徹底」はしてない印象なんだけど。
Re: (スコア:0)
いや、当用漢字時代は新聞報道でも長島と表記されていたけど、今では(というかずいぶん前から)長嶋と表記するようになった(統制が緩んだ)って話。統制が緩んだんだから今でも使われているのは当然
Re: (スコア:0)
新聞社から派遣されてきた国語審議会の委員が当用漢字を制定したの。
何か政府に規制されて長島に矯正されたんじゃなくって、新聞社の利益のために活字のコストを節約すために長島への改名を強制した(その大義名分として政府を利用した)わけ。
写植とかPCとかが普及して長嶋って書いてもコスト変わらなくなったから止めただけ。
Re: (スコア:0)
あれはあれで、簡略化の過程で複数の文字が形が同じになった結果として文字が統合されて意味合いが分かりづらくなるという罠もある。
Re: (スコア:0)
そもそも漢字を表音化するのが当初の最終目標だったのでそれは意図的なのでは。北京官話の発音が同じなら方言では区別される文字でも平気で統合してるとか
Re: (スコア:0)
國鐵廣島 って書いてみろよ
Twitter検索ではヒットしない (スコア:0)
Twitterは、検索できない?ツイートできない?ツイートされていない?
禰豆子の検索結果はありません https://twitter.com/search?f=tweets&vertical=default&q=%E7%A6%... [twitter.com]
Re: (スコア:0)
ツイートはできるようだ。Y!Jリアルタイムでヒットする。
https://search.yahoo.co.jp/realtime/search?p=%E7%A6%B0%F3%A0%84%80%E8%... [yahoo.co.jp]
正規化 (スコア:0)
正規化しろって安易に言うけど、何も考えずに正規化するとJIS X 0213で追加された人名用漢字の一部が化けるんだがそっちはいいのか?
Re: (スコア:0)
人名用漢字を考慮した正規化ルールを標準化すれば良いのです
朴璐美 (スコア:0)
以前声優の「朴璐美」さんの璐の字(王ヘンに路)が使用したいフォントになくて画像として作ったのですが(ポスターでした)スラドでは璐は書けるのかな?
そもそも Unicode が (スコア:0)
Unicode は過去の雑多な文字コードとのラウンドトリップ互換性を維持したせいで、異体字の扱い自体の基準がバラバラで、異体字セレクタが使い難い。
「器」の字体の問題とか。
「高」とかもでも、伝統的に正しいやり方、明朝体や教科書体なら「くち高」、楷書や篆書なら「はしご高」になるような文字の指定はできない。
結局フォントを意識しなければいけないなら、最初からフォントだけで指定した方が早い。
IVS普及の起爆剤 (スコア:0)
絵文字の色変更機能が現在最も使われてるIVSだと思います。(個人の感想です。)