
日本語文字が中華フォント化してしまう問題 247
ストーリー by nagazou
違和感あるからなあ 部門より
違和感あるからなあ 部門より
usagimaruさんによると、気がつかないうちに日本語文字が中華フォント化している現象が広がってしまっているという。同氏によると、言語環境の言語優先度設定で「わざわざ」日本語を優先言語にしておかないと、日本語の文字の多くは簡体中国語の奇妙なフォントで描画されるてしまうそうだ。これはバグではなく仕様であり、世界の多くの人は中華フォントで日本語を眺めているのではないかとしている。同氏はCJK処理系における日本語の扱いに対する問題に対処しないと、ソフトウェアの中の日本語が死んでいってしまう危機感を感じると述べている(usagimaruさんのツイート、Togetter)。
Firefoxの場合 (スコア:5, 参考になる)
当初はどこにも言語指定がないときのデフォルトは日本語だったけど、言語指定のない中国語のページで表示がガタガタになるという中国ユーザーからのクレームでFirefox 72から中国語がデフォルトになった。
https://bugzilla.mozilla.org/show_bug.cgi?id=1581822 [mozilla.org]
もちろん今度は日本語が割を食うことになった。
https://bugzilla.mozilla.org/show_bug.cgi?id=1606744 [mozilla.org]
メジャーな環境では対処法があるのでは? (スコア:3, 興味深い)
これはUnicodeで漢字統合することが決まった30年近く前から知られていた問題で
現代のHTMLなんかでは LANG="ja" のように言語を指定をすると回避できるようになってますね。
その他の描画機構でもこの種の回避方法はなんらかの形で用意されていると思っていたのですが
そうでもないんでしょうか?
Androidの場合はシステムロケールを使うのが流儀らしいですが、
昔のFlutterでがその辺対応してなくて困っていた時期がある [zenn.dev]みたいですね。
今は直ってるみたい [github.com]。
複数言語での入力がありうるアプリでは、入力ごとに正しいロケールを指定できるようにアプリの設計をする必要があるかも。
Re:メジャーな環境では対処法があるのでは? (スコア:1)
もうunicodeにJセレクタ、Cセレクタ、Kセレクタ入れればいいよ。
どうせ絵文字は無秩序に追加しまくってるし、制御文字がちょっと増えたくらい大したことないだろ
Re:メジャーな環境では対処法があるのでは? (スコア:1)
U+2FBB に康熙部首の「⾻」があり、部首に両方登録されているのに、漢字には簡体字の骨が登録されていないのは不思議です。
IVSにも簡体字の「骨」が無いのはAdbe-Japan 1やHanyo-Denshiのコレクションは日本の漢字向けだからでしょうね。
骨に対して⻣は、形としては簡化されていないようなのに、なぜ向きを逆にしたのか?、検索したら画数は少なくなっているのだそうです。「過」の簡体字も同じだそうで。
WIndowsのフォントで試してみたら、Microsoft YaHeiとSimSunは骨(U+9AA8)は簡体字のグリフになりました。
関連リンクにないが (スコア:3, 参考になる)
これを見せれば終わる話でしょ。対応するかは開発者次第。
非漢字圏の開発者にグリフの違いと重要性を解説するウェブページ
https://srad.jp/story/21/11/01/168236/ [srad.jp]
繁体字はまだ読めるが、簡体字は… (スコア:2, おもしろおかしい)
フォント困る
Re: Re: Re:繁体字はまだ読めるが、簡体字は… (スコア:1)
親米で何か妙な勘違いされたようだが「おやコメ」だよ
問い合わせは止めた方が良いです (スコア:1)
日本人の購買力は下がってきているので、問い合わせると日本語環境で満足行くサービスを提供できないので日本語対応をやめるという判断をされることがあります。 問い合わせやバグレポートを送ると、かえって日本語ユーザーに不利益になります。 特に星1のレビューをつけるのは最悪で、日本語ユーザーがアプリの評価を下げるので、日本語対応をやめるという判断になりやすいです。
Re: 問い合わせは止めた方が良いです (スコア:1)
それ実例とかソースとかあるんですかね
Re: (スコア:0)
日本語非対応化ならまだ良い方
「日本語に対応していないので星1です」レビューを避けるために日本地域をリージョンブロックするケースまである
Re: (スコア:0)
「金払いが悪い癖に重箱の隅に異常にうるさい日本人」の見本のような話よね
Re: (スコア:0)
つまり緩やかな死か速やかな安楽死を選べと。
Re: (スコア:0)
本文が事実だとして、問い合わせして日本に対して問題を起こすサービスを止めさせるべきとなるところだと思うけどね。日本の法律を無視したり、脱税してたりしてそう。
元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
他の環境ではどんな状況でしょうか。
Windowsでは見かけません。
Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
Microsoft Teamsがひどい。
デフォルトで生成されるアイコンが、姓のイニシャルの英字+名の漢字、となるが、その漢字が中華フォント。
しかも、ビデオ会議のトランスクリプトも組織アカウントでは英語となり(人に結びつかないアカウントだとなぜか日本語で文章化される)、
会社の大勢をイラつかせる原因となっている。
Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
組織のポリシィでアイコンが変更できないと、このイライラはどこにぶつけたらいいのだろうか。
くさかんむりやしんにょうやいとへんがあるといらっとする。
なべぶたやごんべんのような横棒の上に付く点が短い棒じゃなくて点だったりするといらっとする。
Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
Windowsで役所のPDFから取得したSHIFT-JIS文字列をパワポ(Office365のサブスク版)に貼り付けたら所々中国語っぽいフォントになったり、Excelのグラフをパワポに貼り付けたら特定の系列だけ中国語っぽいフォントになりました。
Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
コピペしてみたけどPowerPoint 2016は、「PMingLiU」になったけど
Word 2016は、「MS明朝」、Excel 2016とOutlook 2016は「遊ゴシック」だった。
Re: Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:2)
あ、遊ゴシック。
Re:元のツイートがApple製品についての発言だとわかる記事してほしい (スコア:1)
Office系はUnicodeの文字コードエリアで言語判定してるんですかねぇ。
O'Reillyのハリセンボン日本語版から20年 (スコア:1)
超今更ですね...
https://www.oreilly.co.jp/books/4873111080/ [oreilly.co.jp]
これは海外ゲームやってるとよく感じますね (スコア:0)
日本語だけど日本の漢字じゃないってのがしょっちゅう。
海外メーカーからしたら区別つかんのだろうけど。
Re: Re:これは海外ゲームやってるとよく感じますね (スコア:1)
UNICODEを使わないなら使わないで、別の問題が出てくるのでは?
あ、これも完璧にご存知なんですよね?
論点を整理していただけます?
# ま、無理だろうな。
Re: Re:これは海外ゲームやってるとよく感じますね (スコア:1)
そもそも日本語を区別できる規格がすでにあるのだからそれを使えばいいというのはべつにおかしくないのでは。
私は、それに限って言えば「おかしい」とは言っていない。
ただ、別の問題が発生する、と言っているだけ。
キミも別の問題が発生しない、という意見じゃないんだろ?
Re: Re:これは海外ゲームやってるとよく感じますね (スコア:1)
Unicodeを日本語を区別するように規格を直すのが筋と思ってるってこと?
そんな妄想で反論されても困惑するばかりだよ。
AもBもどっちも難しい問題があるのに、「AじゃなくてBにすればいいじゃん」は、たとえ遊びにしても、アホ過ぎる、って話をしている。
Re: Re:これは海外ゲームやってるとよく感じますね (スコア:1)
「Unicodeを日本語を区別するように規格を直す」に対するコメントですので。
で、何が問題だと言ってますか?
あなたの書いた#4338606も遊びで書いたのでなければ大概ですよ。
「大概」とは? 何が問題だと言ってますか?
遊びじゃないなら答えを書いてそれで終了だったわけで。
私は、簡単に実現できる答は無いと思いますが、あなたは簡単に実現できる答を持ってるんですか?
そうじゃないでしょ?
どんな答を書くつもりなんですか?
規格を直せ、と言うスジ論は理解しますが、今さらそんなことができますか?
Re: Re:これは海外ゲームやってるとよく感じますね (スコア:1)
#4338606があまりにも偉そうだったので何らかの解決方法を知っていて書いてると思って大概(遊びにしてもアホ)なのではと書きましたが、素直に見れば答えを知っているのか聞いている文ですね。それについては申し訳ないです。
「それについては」と書いてますが、「それ」と言うのは、キミが勝手に勘違いした、と言う事ですね?
それ以外に何かありますか?
それ以外にないのでれば、全面的に訂正するべきで、「それについては」などと言い逃れをするのは、「あまりにも偉そう」でダサ過ぎますよ。
「申し訳ない」等の謝罪は不要です。勘違いは誰にでもあります。必要なのは訂正です。
Fire TVのYouTubeアプリ (スコア:0)
基本的に中華フォントでイラッとするね
サパニーズ判定には便利なんですがね。 (スコア:0)
メールや商品説明で日本人を装うのを見破るには便利ではないだろうか。
Re: (スコア:0)
本物が中華フォントを使うようになるとfalse positiveが無視できなくなってくる
世界的にマイナーだからなぁ (スコア:0)
多言語の取説とか見ても、日本語は無かったりする。
基本的に日本以外に使用している国はない、使用人口の少ないマイナーな言語だと
思い知らさせるひととき。
# だが日本円はハードカレンシだ、と思っていた時期が
Re: (スコア:0)
単に人口が少ない以上に、親戚が沖縄の言語しか無い孤立言語だから
英語からの逐語訳で意味が通じなくて丸ごと書き換えになる所が最大の問題点
中国語なら罷り通る事が出来ない
Re: (スコア:0)
多言語の取説に日本語なかったら「英語くらい読めるだろ?」と言われてる気がしてたわ。
日本語は無くても気にならないタイプ。
フォント変えろ (スコア:0)
単純に言語ごとにフォント変えてねという話でしょ
Unicode作る時にそういう約束だったじゃないですか
Re:フォント変えろ (スコア:2)
しかしまぁ読めるしね…
人口10倍違うしな
Re:フォント変えろ (スコア:1)
>そうじゃなくて言語指定がないときにデフォルトで中国語フォントにされるのが問題という話でしょ
ただデフォルトなら対応できるのだけど、固定されているとどうにもならないんだよ!
>単純に言語ごとにフォント変えてねという話でしょ
>Unicode作る時にそういう約束だったじゃないですか
Unicode使うシステムはフォントが変更できなければならない、という約束もしておくべきでしたね
CJKとかいう表記がもんだいを矮小化している (スコア:0)
本来であればCCJKV問題とすべきである。中国と中国は明確に区別されるべきでありまたベトナムが阻害されているのも本来ありえないことである。
Googleニュースアプリがずっとこれで削除 (スコア:0)
Googleニュースアプリでは、未読のニュースの見出しに使われる文字がずっと簡体字になっています。
読めることは読めるのですが、少しずつストレスが積もって結局アプリは削除しました。
改善を期待して定期的にレビューを確認していますがいまだに変化がないようで…
Re:じゃあどうしろっていうの? (スコア:2)
今更Unicodeを廃止して別のコード規格に移るのはもう無理でしょうから、
現状のUnicodeの仕組みでなんとかするとしたら、異体字セレクタを使うことですかね。
元々、葛飾区の「葛」(中がL人、U+845B)と葛城市の「葛」(中がヒ、U+845B U+E0100)みたいな同一言語内での「異体字」を表現するための機能ですけど、
Han Unification した文字は全て、どの言語なのかも異体字セレクタで指定できるようにすれば、
今回のような問題はおきないし、混在表現も可能になります。
欠点は、メモリ効率が悪いことですかね。1文字の表現に、UTF-16なら3ワード6バイト、UTF-8だと7バイトも必要。
それにしても、
元々「CJKバラバラに収録したら16bitに収めるの厳しいから統合します」とか乱暴なことまでしておいて、
「多バイトでバイト数不定なISO-2022なんか使いにくいだろ。Unicodeなら全ての文字は16bitの1Wordで表現できるぜ。」とUnicodeのメリットを推してたけど、
結局16bitに収まらずにUTF-32とかでてきて、UTF-16だと2ワードで1文字表現するハメになったり、
合字とか1文字のワード数が不定長だし、全然使いやすくない。
ISO-2022とかに比べるとモードレスなのはメリットだけど、
その一方で、異体字セレクタとかは後ろに付くから先読みが必要。
#つい最近、PHPExcel/PHPSpreadsheetでのExcel(xls)出力がサロゲートペアに対応してない問題に出くわしたので、ちょっと恨みがましいです。
IVS(異体字セレクタ)で何とかなるが、かなり手間 (スコア:2)
実際「直」とか「器」なんかだと、既存の異体字セレクタ(IVS)で何とかなるんですけど、かなり手間(「直」の場合 [srad.jp]・「器」の場合 [srad.jp])なんですよね。なかなかサポートしてもらえなさそうだけど、どうしたものかなぁ。
Re:じゃあどうしろっていうの? (スコア:1)
統合できなかったのでしょうか。
Re: (スコア:0)
中国は漢字統合を推進した側。今は違うけど、当時のCJK互換漢字にG-sourceはなかった。つまり中国を必要な漢字は全部統合漢字に入れた(そうなるように統合規則を設定した)ってこと。
Re: (スコア:0)
中国を必要な漢字は→中国は必要な漢字を
Re: (スコア:0)
当時、反対派からの「Unicodeを採用したら漢字が中国のフォントになってしまう」という主張を推進派が荒唐無稽なデマ扱いしてたけど、結局反対派の言ったとおりになってて草も生えない。助けてファクトチェックセンター!
Re:じゃあどうしろっていうの? (スコア:1)
いやいや、フォントは文書に対して指定するものだから。一つの文書の中で細々フォントを変えて対応するのは間違い。
なんでそんなウソを? 10秒も考えれば反例を思いつくでしょうに。
例えば、日本語話者が朝鮮語を学ぶための教科書とか。
Re:じゃあどうしろっていうの? (スコア:1)
異言語を混ぜる場合は例外対応でしょ。
それは、UNICODEが定めるところなのか? それとも、キミの個人的な主義主張なのか?
これだけ国際化が進み、外国人が日本に来ることも珍しくなくなったんだから、複数言語が混在する文書を「例外対応」と考えるのは、そーとー苦しい考え方だろうね。
キミ、本当に他に反例は思いつかないのかい?
複数の言語で書かれたショッピングモールのフロアガイドとか、あるだろ?
トイレの使い方が4ヶ国語くらいで書かれてるのも珍しくない。
小説にしたって、そんなものがあっても何ら不思議は無い。
出版社も、そんな考え方を押し付けられたら、営業妨害に感じちゃうかもよ。
Re:じゃあどうしろっていうの? (スコア:1)
複数の言語で書きたければ複数の言語で書けるフォントを使えば良い
それはそうだけど、各言語により適切なフォントを使ってはいけない理由にはならないじゃない?
キミが言ってるのは例えば、プレインテキストなら当てはまるけど、リッチテキスト以上のものには当てはまらない話に見える。
キミの手元のリッチテキストを扱えるツールはどうなってる? 例えばグラフィカルなウェブブラウザとか。
「フォントは文書に対して指定する」もので、「一つの文書の中で細々フォントを変えて対応」することはできない様になってるかい?
それらツールは「間違ってる」と考えるのかい?
日本語だけの文書だって、地の文を明朝・強調をゴシックと混ぜて使うこともあるし、プログラムコードにはまた違うフォントを使うこともあるだろ?
これは「一つの文書の中で細々フォントを変えて対応」してる例だと思うけど、キミの考えでは違うの?
Re:日本語の字体を中国に合わせろ (スコア:1)
確かに日本語の漢字も一部簡略化があって、中華民国の繁体字の方が元に近い
中国の文字である繁体字に統一するなら可能性はあるかもしれない
Re:日本語の字体を中国に合わせろ (スコア:1)
> 中華民国の繁体字の方が元に近い
繁体字も字体自体は唐代にはだいたい完成してたのでは、
と思ったけと、「もとに近い」だったか。
Re: Re:日本語の字体を中国に合わせろ (スコア:1)
今どき手書きの機会も少なかろうて。