アカウント名:
パスワード:
考察によると、画像圧縮に使われているJBIG2アルゴリズムに関係が有りそうだという。JBIG2はパターンマッチングを利用して圧縮効率を向上させているのだが、パターンマッチングに利用される領域サイズが画像中の文字サイズと同じぐらいの大きさになると、誤認識が発生して別の数字に「張り替え」てしまうらしい。
タレコミの時点ではまだ出ていなかった情報だと思いますが、既にこの辺の推測は全部 Xerox 社の人が事実と確認しています [dkriesel.com]。また、
スキャナーのモード設定には白黒、グレースケール、カラー、テキスト/OCRだとかいろいろあるので、OCRモードの時だけ・OCRフォントだけの問題かと思ったら、普通のフォントの数字が化けるとは驚きましたね(規格で決まってるOCRフォントだけが対象なら認識・圧縮は容易なはず)となると数字化けしやすいフォントとか化けにくいフォント(圧縮率の高いフォント/低いフォント)があったりするのでしょうか?
文字化けの問題は別にして, 低いDPIで視認性の良いフォントというのはFAXで送付する書類用としてニーズがあったりします. 例えばリョービのシリウス [akibatec.net]などが, こうした用途で使われたり.
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
最近の情報 (スコア:5, 興味深い)
タレコミの時点ではまだ出ていなかった情報だと思いますが、既にこの辺の推測は全部 Xerox 社の人が事実と確認しています [dkriesel.com]。また、
Re:最近の情報 (スコア:0)
スキャナーのモード設定には白黒、グレースケール、カラー、テキスト/OCRだとかいろいろあるので、OCRモードの時だけ・OCRフォントだけの問題かと思ったら、普通のフォントの数字が化けるとは驚きましたね(規格で決まってるOCRフォントだけが対象なら認識・圧縮は容易なはず)
となると数字化けしやすいフォントとか化けにくいフォント(圧縮率の高いフォント/低いフォント)があったりするのでしょうか?
Re:最近の情報 (スコア:1)
文字化けの問題は別にして, 低いDPIで視認性の良いフォントというのはFAXで送付する書類用としてニーズがあったりします. 例えばリョービのシリウス [akibatec.net]などが, こうした用途で使われたり.