「ディスコード」→「ヅァシヶョデ」などの謎誤植で書籍が発売延期に 47
ストーリー by nagazou
誤植 部門より
誤植 部門より
1月10日に発売予定だった書籍『言語オタクが友だちに700日間語り続けて引きずり込んだ 言語沼』が、多くの誤植発生により1月24日発売に延期になったことが話題になっている。あさ出版のサイトに掲載されている正誤表によると、誤植と正しい内容は次の通り(あさ出版、ねとらぼ)。
相好(そうこう)→相好(そうごう)
本居宣長(むてえよぬよとか)→本居宣長(もとおりのりなが)
Pepper(ペッパーくん)→Pepper(ペッパー)
角回(ぉきぉあ)→角回(かくかい)
白鵬(ねきぺい)→白鵬(はくほう)
稀勢(かす)の里(こて)→稀勢(きせ)の里(さと)
Discord(ヅァシヶョデ)→Discord(ディスコード)
Slack(ショチキ)→Slack (スラック)
藤原不比等(びざろょぬびばて)→藤原不比等(ふじわらのふひと)
秋田喜美(かぽ)氏→秋田喜美(きみ)氏
UTF‐8(ヤョツァョウビウアテ)→UTF‐8(ユーティーエフエイト)
誤植の内容からPDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化けが原因ではないかという指摘も出ているようだ。しかし、それだけでは説明のつかないものもみうけられるという。
再現方法と原因 (スコア:3, 参考になる)
再現する方法が見つかったという話が年末に出てます
https://twitter.com/peprintenpa/status/1607951187269287937 [twitter.com]
> お、再現できた
> https://pbs.twimg.com/media/FlCW8d9agAEjVz9?format=png [twimg.com]
https://twitter.com/peprintenpa/status/1607952594194006018 [twitter.com]
> Win10の「游ゴシック」とAdobe Fontsの「游ゴシック体 Pr6N」で合成フォントファミリーを作るとこうなる
> (理屈はこれhttp://sysys.blog.shinobi.jp/Entry/98/)理屈はこれ http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp] )
詳しくは上の
http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp]
に書いてありますが、Adobe のソフトウェア (InDesign?) のバグが原因らしいです。
Re:再現方法と原因 (スコア:5, 興味深い)
うわー。これはかなり特殊な条件だなぁ。
1. 合成フォントを使っている
2. 合成フォントを使ったテキストにルビを振っていて、ルビのフォントを自動指定している
3. 合成フォントの名付けルールで、ウェイトの表現に-Wnを使っている
4. 3で出来たフォントファミリーの中に、異なるcmapのフォントが含まれる
このうち、1.~3.まではほぼ全くおかしくない作業だけど、4.はかなりおかしいね。まぁStdとStdNを平気で混ぜるようなヤカラもいるからなぁ。
それでも、ここまでは設計者か作業者がヘボいという話で済むけど、そのまま出版しちゃあダメだよねぇ。校正フローどうなってんの?ってなっちゃう。
Re:再現方法と原因 (スコア:5, 参考になる)
「DF平成明朝体W9」などで、単体のフォント再現してますし、
合成フォントは再現しやすいだけで原因ではないでしょう。
・「同じフォントのウェイト違いでcmapが異なる」ようなフォントで、ノーマル以外のウェイトを使って
・InDesignでルビを振り、ルビのウェイト設定が自動(無指定)だと、
・ルビ部分は、ノーマルウェトのcmapで取得したグリフIDで、指定ウェイトのフォントの描画を行う
ので、文字が化ける。と。
cmapが異なるフォントでもルビのウェイトを明示的に指定してれば化けない。
上記のフォントは縦書きの場合のみ発生していますが、これは縦と横で別のグリフを使っていて、
横書き用グリフはずれてないけど、後ろの方の縦書き用グリフはずれてるっぽい、と。
で、その推測を元に再現実験したのが合成フォントの例。
Re:再現方法と原因 (スコア:2)
あーそっか。そうなると怖いけど、同じ条件を満たすフォントってまぁないですよね(あったら怖いな)。
うろ覚えだけど、かなり昔(os9とかのころ)のDF平成明朝体ってW9だけなんか扱いが違った記憶がある(ファミリーから外れてるとかそんな印象)けど、あれ関係あるのかな。今販売してるのは流石に大丈夫なのかな?
Re: (スコア:0)
「校正」としているプロセスの後でこれが発生したらツラいのでは。実物見られないけどルビ部分で時々発生してるやつなんだよね?
# 相好はそうこうだと思ってましたすいません
Re:再現方法と原因 (スコア:2)
それはその通りで、@peprintenpa氏曰く、「一部のフォントの組み合わせによっては、ファイルを開いただけで文字化けが発生するパターンもありうる」ということもあり(極めて稀に稀を重ねた条件ではあるものの)、そうなると危険度は爆発的に上がりますね。
具体的には:
A. 作業者の念校まで一貫した環境からinddファイルを受け渡し、突然別の環境から入稿用PDFを作る
B. 製版者がinddファイルを直接入稿用として要求し、そのinddファイルから製版する
のどちらかで、かつお互いの環境が問題を発生させる条件を満たす場合です。
ただし、AもBも正しい工程ではないです。この場合それぞれ、Aは作業側の責任、Bは製版側の責任でしょう。(でも、いまだにPDF入稿じゃないとこあるんだよな……)
理想的なフローでは、念校用PDF=入稿用PDFで、それがそのまま製版されるわけですから、こういった問題が作業のタイミングで発生していたとしても、出版までには至らないでしょう。
まぁ現実的には、無茶な日程やおかしなタイミングで修正やフォントの変更が発生し、校正の工程がヌケたかずさんであったというのが一番ありえそうです。その場合バグ自体は珍しいものの、よくある話です。
似たような事案 (スコア:2, 興味深い)
https://nlab.itmedia.co.jp/nl/articles/2212/29/news097.html [itmedia.co.jp]
この事例では「Microsoft Print to PDFで出力して提出→業者がIllustratorで読み込み」でバグったらしいですよ
ドラクエIIの (スコア:2)
もよもとを思い出した
Re: (スコア:0)
× もよもと
○ もょもと
Re: (スコア:0)
Iのおっ゜てのことも時々でいいから思い出してください
真言とか呪言とか (スコア:1)
漏らしたんすかね
規則性が分からん (スコア:0)
文字コードが1か2前の文字に化けているようだけど
変わってないものもあるし
文字列が切れている「ペッパーくん」だけは人間の入力ミス、他は何らかの処理の過程で化けた。
現存人物の人名(ペンネーム)らしきものがいくつか見られるので、これが原因で正誤表で済ますわけにはいかなかったのかな。
Re: (スコア:0)
アホなエンジニアが計算ミスで文字コード表の座標を間違えただけ? と気づいたが
(バギーに書き捨てコード作る自分もその手のアホをよくやらかすので境界判定と双頭w)
拗音の「ょ」「ョ」が「ら」「ラ」になってる以外に長音「-」に化けてるのも
あるのが謎なのよね
Re:規則性が分からん (スコア:2, 興味深い)
本当にPDFから変換したのならありうる話であほなエンジニアが計算ミスしたわけではない。
PDF内の文字コード(?)はフォントの位置を示しているのでその位置から文字コードを逆算しなければいけない。(文字コードそのままの時もあってその時は問題が少ない)
その場合、変換表がPDF内にあればいいけどない物もある。無くてもそれが既知の場合は何とかなる。
変換表があったとしてもその変換表が実際と違うこともある。一つのフォントに複数の文字コードが対応していて変換表は最初の文字と結びついていても実際は2番目の文字ということもある。
本当にPDFからIllustratorならAdobe頑張れと思うと同時に自分が作った変換ソフトがダメダメでもまあいいかと安心する。
Re:規則性が分からん (スコア:1)
どこにレスをつけるか迷ったけど、とりあえずわかってそうなここに。
「グリフコード」と「文字コード」の変換表のはなしだよね。
基本的な(得に欧米とかの)フォントだと「グリフコード」と「文字コード」が一致しているので問題がおきないけど、日本語とかで使われるCIDフォントではこの二つは一致していないため変換表が必要になる。
PDFの作り方にもよるけど印刷用の最終PDFの場合はこの変換表をPDFに埋め込まずにグリフコード直で埋め込む場合もある(これをやるとコピペとかが文字化けするんだけど印刷用なら問題なし)
そういう処理をしたやつを再編集して、後から別のフォントに置き換えると文字化けが起こる(フォントによってグリフコードは異なるので)。今回は主に振り仮名で発生しているみたいなので、印刷用PDFを再編集して振り仮名のフォントを別のみ変更したんじゃないかな?
Re:規則性が分からん (スコア:1)
ときどき話題になる康煕部首混入問題もこれが原因(Adobe Japan-1では康煕部首と通常の漢字に同じCIDを使っているので逆変換がうまくいかないことがある)。
Re: (スコア:0)
当時Photoshopがサブスクになったのが嫌で
CS2や6.0を無理やりインストした時もフォント周り以外は動作できた
Adobeはフォント周りが弱い
Re: (スコア:0)
羽生九段は振り飛車が苦手
みたいな話やな
日本のベンダがAdobeの半分でもフォントに強ければよかったのにね
Re:規則性が分からん (スコア:1)
半角カナと全角カナが混在していて、
「ョ」(e383a7) → 「ラ」(e383a9)
「ョ」(efbdae) → 「ー」(efbdb0)
となってるのかな?
長音だけ半角にしていることを説明できる理由が思いつかないけど
Re: (スコア:0)
これが文字コード変換のミスなら出版社が使ってるソフトの問題ということでは…
Re: (スコア:0)
たぶん全体的にUTF-8の表で2文字前になってしまってる。
ペッパーくんは不思議ですねぇ・・・
Re: (スコア:0)
ShiftJIS→UTF8/16の変換ライブラリのどれかで、似たような形の別の文字に変換される事例がありますね。
どういうロジックでそうなるのかは知らんけど。
つまりこういう事ですね? (スコア:0)
スラドが書籍でなくて良かった
Re: (スコア:0)
スラドなら許されたのに
#書籍でもスラドなら仕方がないで・・・
文字化け (スコア:0)
PDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化け
って有名な事象のようですが、なんで直らないの? PDFを作った方か、Adobeのソフトか、どっちが悪いの?
Re:文字化け (スコア:2, 興味深い)
一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。
各文字は文字コードではなく、フォント内のグリフ番号で指定されています。
そのまま印刷するのは問題ありませんが、別ソフトで読み込む場合などには、元のテキストを復元する必要があります。
しかしながら、情報が失われていて元のテキストを復元できないケースが往々にしてあります。
正直、PDFはデータ交換用には向いていないファイル形式だと思うんですよね……。
ファイル構造を調べてみると、あまりのゴタマゼ具合に眩暈がするほど。
(歴史のあるフォーマットなので、屋上屋を重ねすぎてカオスです。ほんとに)
Re: (スコア:0)
ポータブルなのに…
Re: (スコア:0)
一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
IllustratorやInDesign上でテキストを含めた全てをアウトライン化して、PDF化して入稿すれば良い話じゃないんですか?
そもそもプリフライトチェッカーをかけたときに指摘が入ってるんじゃないでしょうか。
技術的な意味でPDF入稿にテクニカルな問題や躓きポイントがある指摘は同意しますが、2010年中盤からは多くの印刷がPDF入稿であり、印刷所側も細かく対応してると思いますけどね。
自分はもうここ何年も印刷・入稿した事がないので、最近の事情が違ってたらすいませんが。
Re:文字化け (スコア:2)
最終の本印刷の前に印刷用データを使った色校正が入るはずですので、そこで見落としたのが一番のミスですね。
Re: (スコア:0)
今はアウトライン化はしないんですね。勉強になりました。
もし可能なら教えてほしいのですが、昔は文字ばかりの文庫本とかを除くと基本的にアウトライン化は必須だった記憶があるんですが
今はアウトライン化をしない理由って何なんですかね。容量の問題とかですか? それともアウトライン化によって別の不具合や依存等が発生するんですか?
Re:文字化け (スコア:3)
PDF入稿でしたらほぼ確実にフォントがPDFに埋め込まれますのでなおさらかと。
またアウトラインを取ることによって文字が太く見えてしまうことも原因だと感じています。
Re: (スコア:0)
一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。
私のお墓の前で 泣かないでください そこに私はいません・・・みたいな感じなのか
Re:文字化け (スコア:1)
文字コードも言語と同じくまた沼なのです。
その沼に果敢にチャレンジし、そして力尽きて沈んでいった連載がこちら:
小形克宏の「文字の海、ビットの舟」 [impress.co.jp]
Re: (スコア:0)
というか、文字化けなら何故漢字は文字化けしてないの?って疑問があるんだが。
括弧内だけ文字化けするなんてどんな状況だよ。
Re: (スコア:0)
括弧内だけフォントが違うと想像
Re: (スコア:0)
イラレがpdfの埋め込みフォントを破棄するから。
イラレの仕様。つまり、イラレを使う側が理解して対処しなければならない。
Re: (スコア:0)
そもそもPDFは各種のプログラムで読み込んで修正を加えることの出来るフォーマットという認識が常態化しているので、どんなトラブルが起きてもおかしくはない(adobeも例外では無い)
#jpegとかpngとかgifとかtiffとか画像ファイル化したものをPDFに変換すればいいんですよ
言語沼だけに (スコア:0)
そういう言語、という開き直りはさすがにできなかったか。
Re: (スコア:0)
何はともあれ、宣伝としては大成功なんじゃないかしら。
角回って、 (スコア:0)
次に力士の名前が出てくるから角界の typo かと思ったが、technical term [wikipedia.org] があるのね、それも言語に関係するのが。
関連リンク (スコア:0)
お、再現できた [twitter.com]
読者みんなが (スコア:0)
ひんたぼ語のカルチャーセンターに通えば解決。
#どうやら完全なシーザー暗号でもなさそうだけどね
既に買った人には訂正表載せて終わり? (スコア:0)
http://www.asa21.com/news/n50730.html [asa21.com]
発売延期するような酷い誤植やらかして、既に買った人に対しては訂正表載せて終わりってことなの?
Re: (スコア:0)
こういうはっちゃけたtypo版は逆に価値が上がりそう。スラドとは違って。
Re: (スコア:0)
Re: (スコア:0)
著者のYouTubeチャンネルによると、
誤植版は一部オンライン書店で先行販売されたもので、購入した人には後日訂正版を送付または返金対応。
訂正版発売もトピックでは1/24となっているがその後さらに延期が決定し現時点では発売日未定。
また当該出版社からは訂正版一刷までとし、以降は版権を引き上げて別の出版社から出版予定とのこと。
重力語 (スコア:0)
ツデローヘデームベドーン
ヂッハベ
ドッフルギャンガフフフフフフフフ
とかの類かも