IPAmj明朝フォントVer.003.01リリース

IPAmj明朝フォントVer.003.01リリース 23

ストーリー by headless 2014年09月21日 15時56分
明朝部門より

yasuoka 曰く、

情報処理推進機構(IPA)は19日、IPAmj明朝フォントVer.003.01を公開した(プレスリリース)。

本バージョンでは収録漢字数が58814字から58815字に1字だけ増えるとともに、既存グリフにUCSやIVSが追加されている。増えた文字はMJ068054であり、内容的にはMJ057480のバグフィックスである。MJ057480は戸籍統一文字112430として作られたが、横画が1画多かったために修正が必要となっていた。修正するにあたってMJ057480のグリフは変更せず、新たに追加したMJ068054に戸籍統一文字112430を対応させることにした。なお、MJ068054には近い将来IVSが付与され、IPAmj明朝フォントもアップデートされる予定である。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索23コメント Log In/Create an Account

互換性維持 (スコア:1)

by m_nukazawa (46323) on 2014年09月19日 20時10分 (#2679721) ホームページ日記

詳しい理由はわかりませんが、こうしてまた漢字が一文字増えるのですね。
(本当に増えたのか既存の漢字に該当する字があったのかすら、わからない門外漢ですが。)
- 増えたのは「彚」 (スコア:2)
  
  by bghtyu67 (46369) on 2014年09月21日 18時33分 (#2680519) 日記
  
  語彙の「い」の別の書き方らしいです．ウィクショナリー [wiktionary.org]によると，
  戦前ではもっぱら彙の字形は「彚」の形で書かれていた。これは文部省活字の表[1]や漢字字体規範データベースを見ても明らかである。しかしどういうわけか、現在フォントベンダーが売っている手書き書体に収められている「彙」の字形はいわゆる康煕字典体に準じたものとなっている。また、日本漢字能力検定において「彚」は「彙」の許容字体として認められていないため、「彚」で書くと失点扱いになってしまう。
  Windowsに入っているPMingLiUという中国語フォント？には収録されていました．
  Unicodeは5F5A．
  
  シェア
  
  親コメント
  - Re:増えたのは「彚」 (スコア:1)
    
    by Anonymous Coward on 2014年09月21日 20時00分 (#2680552)
    
    正確にはそのさらに異体字ですね(上の部分の2画目が突き出して3画目が突き出していない)
    
    シェア
    
    親コメント
    - Re:増えたのは「彚」 (スコア:2)
      
      by bghtyu67 (46369) on 2014年09月21日 22時03分 (#2680596) 日記
      
      本当ですね．全く気づきませんでした．
      漢字ってややこしいなあ．
      
      シェア
      
      親コメント
- Re:互換性維持 (スコア:1)
  
  by Anonymous Coward on 2014年09月21日 15時49分 (#2680468)
  
  http://mojikiban.ipa.go.jp/1287.html [ipa.go.jp]
  Q1. 文字情報基盤とは何ですか？
  A1. 人名等を正確に表記する必要のある行政業務で用いられる漢字約6万文字を整備して国際標準化を行う事業です。詳しくはこちらをご覧ください。成果物としての文字フォントと文字情報一覧表を無償で提供しています。
  Q5. 6万文字を使う必要があるのでしょうか？
  A5. （略）氏名など、個人のアイデンティティに関わる文字を厳密に指定すべき用途（略）逆に、氏名の表記等、個人のアイデンティティに関わる文字においては、意味や読みが同じだからといって、複数の類似な文字を一つの文字に集約してしまうことが必ずしも適当ではない場合もあります。（略）
  Q7. 文字情報基盤は漢字を増やす事業でしょうか？
  A7. 文字情報基盤は、現在、行政の実務で人名等の正確な表記のために実際に必要とされているにもかわらず、標準化されていないために、「外字」という形で使用されている文字を再整理し、国際標準に基づいて使用できる様にすることを目的としています。文字を増やすことは目的としていません。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by shibuya (17159)
    
    ＞文字を増やすことは目的としていません。
    目的を精査確認すること自体は個人的にどうでもよくて、結果的に文字が増えることを排除しているか否かを伝えているのか、それで実際に文字が増えたかどうかということを直接的に読解できるような記述はあるんでしょうか?
    - Re:互換性維持 (スコア:1)
      
      by Anonymous Coward on 2014年09月21日 17時57分 (#2680507)
      
      目的は外字を整理・標準化すること
      文字数の増減は気にしない（整理するんだから、増減するのは当たり前）
      ということです。ちゃんと読解してください。
      そもそも、今回の修正で、一文字増えて、合計58815文字になったっていう情報は
      タレコミにも書いてる訳で、まずはそこから読解したら方がいいのでは？
      （詳細な情報は、IPAのページに書いてありますが、長文なので貴方には読解できないと思います。）
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        「増減」と言っても明らかなバグ字形でさえ削除できないんだから(その判断自体は正しいと思うけど)減らすことは事実上不可能だよね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      個人的にどうでもいいことが、知りたいことに重要な連関をもつことはありうるから
      どうでもいいことであってもしっかり学ぶ必要がある。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    文字が増えたかどうかはともかく、文字コードは増えたよな。
    サロゲートペアってのは、UTF-16に特有の現象で、要するに「本物のユニコード」は65535文字に納まりきらないから、論理的に考えて16bitでは表現できず、「ユニコードの1文字」に対して「16bitのコード」を複数使って表現する話。つまり、エンコーディングが16bit単位だからややこしくなっているだけで、最初からユニコードは32bitなんだ、と思えばこんな問題は発生しない。
    一方、IVS(表意文字異体字セレクタ)は、ユニコードに番号が振られていない字体を特殊なユニコードで指定する試み。つまり、異
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      UTFとUCSをごっちゃにしてませんか？
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        こうなったからには一緒ですよ。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        自分の無知をごまかすのは良くないよ。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        UTFって何ですか？聞いたことないんだけど。
        
        Re:互換性維持 (スコア:1)
        
        by Anonymous Coward on 2014年09月21日 22時31分 (#2680608)
        
        なんでそんな人がこのツリーの末端にわざわざレス付けるのか…
        # 開き直りかたが小学生レベル
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        UCS Transform Format
        UCSとUTFが一緒となると、スタックがオーバーフローしそうな予感がします
        
        UTF is not a Transform Format (スコア:0)
        
        by Anonymous Coward
        
        GNU's Not UnixとかPHP: HyperText ProcessorとかWine Is Not an Emulatorとかが生きているようなのでなんとかなるのではないでしょうか。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      > 外資系独占企業と政府系組織の仁義なき戦い
      実際のところ日本ローカルな問題だから割とどうでもいいような。
      CJKVのうちCは簡体字にユニファイするだけ、というか標準字形に包摂を決めるのは歴代王朝の重要な業務だからね。そこで俺の名字は代々これとか言っても、それは皇帝の名前と被るからお前が改名しろと言われる社会だし。台湾の事情は知らんがどうせそのうち中国に吸収されるし、KとVは日常ではもう漢字使ってないし。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        > 実際のところ日本ローカルな問題だから割とどうでもいいような。
        日本語向けのコレクションしか登録されていないあたりが何より雄弁に物語っていますよね。標準規格にするから形式的には地域依存しない体裁を整えたけど、事実上もっぱら日本のためだけに用意された仕様。
        UCSの統合規則は中国の印刷通用漢字字形表とおおむね一致しているので中国はそもそもUCSでそれほど困っていない(UROは中国主導で定められたのだから当然かも知れないが)。実際G Sourceの互換漢字は存在しない(CJKC_SR.txtにG欄は存在しない)。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        > Cは簡体字にユニファイするだけ
        あ、一つ誤解を訂正しておくと、中国は確かに印刷通用漢字字形表(現在は通用漢字規範表)に基づいて新字形 [wikipedia.org]を標準と定めているので旧字形との違いには頓着しないようだけど、簡体字と繁体字は全部分離して収録している。CJKC_SR.txtにG欄がないのは、中国は必要なら何としてでも(たとえば架空の国内規格をでっち上げてでも)統合漢字にねじ込んでいるからでもある。
        あと中国は昔から合成で一文字を表すのが嫌いなようで、たとえばTaboo var [unicode.org]
- Re:互換性維持 (スコア:1)
  
  by Anonymous Coward on 2014年09月21日 16時18分 (#2680479)
  
  JIS漢字の妛を思い起こさせるバグですね。
  
  シェア
  
  親コメント
Noto Sans CJK (スコア:1)

by Anonymous Coward on 2014年09月21日 17時16分 (#2680494)

そういえば、最近Noto Sans CJK もVersion 1.001にアップデートされてましたね。
http://www.google.com/get/noto/updates.html#u20140912 [google.com]
- Re: (スコア:0)
  
  by Anonymous Coward
  
  フォントもアップデートを随時確認しないといけない時代か……

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

IPAmj明朝フォントVer.003.01リリース 23

IPAmj明朝フォント、Ver.003.01にバージョンアップ More ログイン

互換性維持 (スコア:1)

増えたのは「彚」 (スコア:2)

Re:増えたのは「彚」 (スコア:1)

Re:増えたのは「彚」 (スコア:2)

Re:互換性維持 (スコア:1)

Re: (スコア:0)

Re:互換性維持 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:互換性維持 (スコア:1)

Re: (スコア:0)

UTF is not a Transform Format (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:互換性維持 (スコア:1)

Noto Sans CJK (スコア:1)

Re: (スコア:0)

スラド