「ディスコード」→「ヅァシヶョデ」などの謎誤植で書籍が発売延期に

「ディスコード」→「ヅァシヶョデ」などの謎誤植で書籍が発売延期に 47

ストーリー by nagazou 2023年01月06日 8時03分
誤植部門より

1月10日に発売予定だった書籍『言語オタクが友だちに700日間語り続けて引きずり込んだ言語沼』が、多くの誤植発生により1月24日発売に延期になったことが話題になっている。あさ出版のサイトに掲載されている正誤表によると、誤植と正しい内容は次の通り（あさ出版、ねとらぼ）。

相好（そうこう）→相好（そうごう）
本居宣長（むてえよぬよとか）→本居宣長（もとおりのりなが）
Pepper（ペッパーくん）→Pepper（ペッパー）
角回（ぉきぉあ）→角回（かくかい）
白鵬（ねきぺい）→白鵬（はくほう）
稀勢（かす）の里（こて）→稀勢（きせ）の里（さと）
Discord（ヅァシヶョデ）→Discord（ディスコード）
Slack（ショチキ）→Slack （スラック）
藤原不比等（びざろょぬびばて）→藤原不比等（ふじわらのふひと）
秋田喜美（かぽ）氏→秋田喜美（きみ）氏
UTF‐8（ヤョツァョウビウアテ）→UTF‐8（ユーティーエフエイト）

誤植の内容からPDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化けが原因ではないかという指摘も出ているようだ。しかし、それだけでは説明のつかないものもみうけられるという。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索47コメント Log In/Create an Account

再現方法と原因 (スコア:3, 参考になる)

by Anonymous Coward on 2023年01月06日 11時26分 (#4390206)

再現する方法が見つかったという話が年末に出てます
https://twitter.com/peprintenpa/status/1607951187269287937 [twitter.com]
> お、再現できた
> https://pbs.twimg.com/media/FlCW8d9agAEjVz9?format=png [twimg.com]
https://twitter.com/peprintenpa/status/1607952594194006018 [twitter.com]
> Win10の「游ゴシック」とAdobe Fontsの「游ゴシック体 Pr6N」で合成フォントファミリーを作るとこうなる
> （理屈はこれhttp://sysys.blog.shinobi.jp/Entry/98/）理屈はこれ http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp] ）
詳しくは上の
http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp]
に書いてありますが、Adobe のソフトウェア (InDesign？) のバグが原因らしいです。
- Re:再現方法と原因 (スコア:5, 興味深い)
  
  by yume (47405) on 2023年01月06日 13時22分 (#4390275) 日記
  
  うわー。これはかなり特殊な条件だなぁ。
  1.　合成フォントを使っている
  2.　合成フォントを使ったテキストにルビを振っていて、ルビのフォントを自動指定している
  3.　合成フォントの名付けルールで、ウェイトの表現に-Wnを使っている
  4.　3で出来たフォントファミリーの中に、異なるcmapのフォントが含まれる
  このうち、1.～3.まではほぼ全くおかしくない作業だけど、4.はかなりおかしいね。まぁStdとStdNを平気で混ぜるようなヤカラもいるからなぁ。
  それでも、ここまでは設計者か作業者がヘボいという話で済むけど、そのまま出版しちゃあダメだよねぇ。校正フローどうなってんの？ってなっちゃう。
  
  シェア
  
  親コメント
  - Re:再現方法と原因 (スコア:5, 参考になる)
    
    by taka2 (14791) on 2023年01月06日 14時03分 (#4390305) ホームページ日記
    
    「DF平成明朝体W9」などで、単体のフォント再現してますし、
    合成フォントは再現しやすいだけで原因ではないでしょう。
    ・「同じフォントのウェイト違いでcmapが異なる」ようなフォントで、ノーマル以外のウェイトを使って
    ・InDesignでルビを振り、ルビのウェイト設定が自動(無指定)だと、
    ・ルビ部分は、ノーマルウェトのcmapで取得したグリフIDで、指定ウェイトのフォントの描画を行う
    ので、文字が化ける。と。
    cmapが異なるフォントでもルビのウェイトを明示的に指定してれば化けない。
    上記のフォントは縦書きの場合のみ発生していますが、これは縦と横で別のグリフを使っていて、
    横書き用グリフはずれてないけど、後ろの方の縦書き用グリフはずれてるっぽい、と。
    で、その推測を元に再現実験したのが合成フォントの例。
    
    シェア
    
    親コメント
    - Re:再現方法と原因 (スコア:2)
      
      by yume (47405) on 2023年01月06日 14時44分 (#4390327) 日記
      
      あーそっか。そうなると怖いけど、同じ条件を満たすフォントってまぁないですよね（あったら怖いな）。
      うろ覚えだけど、かなり昔（os9とかのころ）のDF平成明朝体ってW9だけなんか扱いが違った記憶がある（ファミリーから外れてるとかそんな印象）けど、あれ関係あるのかな。今販売してるのは流石に大丈夫なのかな？
      
      シェア
      
      親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    「校正」としているプロセスの後でこれが発生したらツラいのでは。実物見られないけどルビ部分で時々発生してるやつなんだよね？
    # 相好はそうこうだと思ってましたすいません
    - Re:再現方法と原因 (スコア:2)
      
      by yume (47405) on 2023年01月06日 14時30分 (#4390321) 日記
      
      それはその通りで、@peprintenpa氏曰く、「一部のフォントの組み合わせによっては、ファイルを開いただけで文字化けが発生するパターンもありうる」ということもあり（極めて稀に稀を重ねた条件ではあるものの）、そうなると危険度は爆発的に上がりますね。
      具体的には：
      A. 作業者の念校まで一貫した環境からinddファイルを受け渡し、突然別の環境から入稿用PDFを作る
      B. 製版者がinddファイルを直接入稿用として要求し、そのinddファイルから製版する
      のどちらかで、かつお互いの環境が問題を発生させる条件を満たす場合です。
      ただし、AもBも正しい工程ではないです。この場合それぞれ、Aは作業側の責任、Bは製版側の責任でしょう。（でも、いまだにPDF入稿じゃないとこあるんだよな……）
      理想的なフローでは、念校用PDF＝入稿用PDFで、それがそのまま製版されるわけですから、こういった問題が作業のタイミングで発生していたとしても、出版までには至らないでしょう。
      まぁ現実的には、無茶な日程やおかしなタイミングで修正やフォントの変更が発生し、校正の工程がヌケたかずさんであったというのが一番ありえそうです。その場合バグ自体は珍しいものの、よくある話です。
      
      シェア
      
      親コメント
似たような事案 (スコア:2, 興味深い)

by Anonymous Coward on 2023年01月06日 11時11分 (#4390196)

https://nlab.itmedia.co.jp/nl/articles/2212/29/news097.html [itmedia.co.jp]
この事例では「Microsoft Print to PDFで出力して提出→業者がIllustratorで読み込み」でバグったらしいですよ
ドラクエIIの (スコア:2)

by iwakuralain (33086) on 2023年01月06日 12時46分 (#4390250)

もよもとを思い出した
- Re: (スコア:0)
  
  by Anonymous Coward
  
  × もよもと
  ○ もょもと
- Re: (スコア:0)
  
  by Anonymous Coward
  
  Iのおっ゜てのことも時々でいいから思い出してください
真言とか呪言とか (スコア:1)

by nemui4 (20313) on 2023年01月06日 8時09分 (#4390117) 日記

漏らしたんすかね
規則性が分からん (スコア:0)

by Anonymous Coward on 2023年01月06日 8時24分 (#4390122)

文字コードが1か2前の文字に化けているようだけど
変わってないものもあるし
文字列が切れている「ペッパーくん」だけは人間の入力ミス、他は何らかの処理の過程で化けた。
現存人物の人名(ペンネーム)らしきものがいくつか見られるので、これが原因で正誤表で済ますわけにはいかなかったのかな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  アホなエンジニアが計算ミスで文字コード表の座標を間違えただけ？と気づいたが
  （バギーに書き捨てコード作る自分もその手のアホをよくやらかすので境界判定と双頭ｗ）
  拗音の「ょ」「ョ」が「ら」「ラ」になってる以外に長音「－」に化けてるのも
  あるのが謎なのよね
  - Re:規則性が分からん (スコア:2, 興味深い)
    
    by Anonymous Coward on 2023年01月06日 9時02分 (#4390128)
    
    本当にPDFから変換したのならありうる話であほなエンジニアが計算ミスしたわけではない。
    PDF内の文字コード（？）はフォントの位置を示しているのでその位置から文字コードを逆算しなければいけない。（文字コードそのままの時もあってその時は問題が少ない）
    その場合、変換表がPDF内にあればいいけどない物もある。無くてもそれが既知の場合は何とかなる。
    変換表があったとしてもその変換表が実際と違うこともある。一つのフォントに複数の文字コードが対応していて変換表は最初の文字と結びついていても実際は２番目の文字ということもある。
    本当にPDFからIllustratorならAdobe頑張れと思うと同時に自分が作った変換ソフトがダメダメでもまあいいかと安心する。
    
    シェア
    
    親コメント
    - Re:規則性が分からん (スコア:1)
      
      by Anonymous Coward on 2023年01月06日 11時43分 (#4390216)
      
      どこにレスをつけるか迷ったけど、とりあえずわかってそうなここに。
      「グリフコード」と「文字コード」の変換表のはなしだよね。
      基本的な（得に欧米とかの）フォントだと「グリフコード」と「文字コード」が一致しているので問題がおきないけど、日本語とかで使われるCIDフォントではこの二つは一致していないため変換表が必要になる。
      PDFの作り方にもよるけど印刷用の最終PDFの場合はこの変換表をPDFに埋め込まずにグリフコード直で埋め込む場合もある（これをやるとコピペとかが文字化けするんだけど印刷用なら問題なし）
      そういう処理をしたやつを再編集して、後から別のフォントに置き換えると文字化けが起こる（フォントによってグリフコードは異なるので）。今回は主に振り仮名で発生しているみたいなので、印刷用PDFを再編集して振り仮名のフォントを別のみ変更したんじゃないかな？
      
      シェア
      
      親コメント
      - Re:規則性が分からん (スコア:1)
        
        by Anonymous Coward on 2023年01月06日 19時32分 (#4390539)
        
        ときどき話題になる康煕部首混入問題もこれが原因(Adobe Japan-1では康煕部首と通常の漢字に同じCIDを使っているので逆変換がうまくいかないことがある)。
        
        シェア
        
        親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      当時Photoshopがサブスクになったのが嫌で
      CS2や6.0を無理やりインストした時もフォント周り以外は動作できた
      Adobeはフォント周りが弱い
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        > Adobeはフォント周りが弱い
        羽生九段は振り飛車が苦手
        みたいな話やな
        日本のベンダがAdobeの半分でもフォントに強ければよかったのにね
  - Re:規則性が分からん (スコア:1)
    
    by Anonymous Coward on 2023年01月06日 9時22分 (#4390147)
    
    半角カナと全角カナが混在していて、
    「ョ」(e383a7) → 「ラ」(e383a9)
    「ｮ」(efbdae) → 「ｰ」(efbdb0)
    となってるのかな？
    長音だけ半角にしていることを説明できる理由が思いつかないけど
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    これが文字コード変換のミスなら出版社が使ってるソフトの問題ということでは…
- Re: (スコア:0)
  
  by Anonymous Coward
  
  たぶん全体的にUTF-8の表で２文字前になってしまってる。
  ペッパーくんは不思議ですねぇ・・・
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ShiftJIS→UTF8/16の変換ライブラリのどれかで、似たような形の別の文字に変換される事例がありますね。
  どういうロジックでそうなるのかは知らんけど。
つまりこういう事ですね？ (スコア:0)

by Anonymous Coward on 2023年01月06日 8時33分 (#4390123)

スラドが書籍でなくて良かった
- Re: (スコア:0)
  
  by Anonymous Coward
  
  スラドなら許されたのに
  ＃書籍でもスラドなら仕方がないで・・・
文字化け (スコア:0)

by Anonymous Coward on 2023年01月06日 9時06分 (#4390134)

PDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化け
って有名な事象のようですが、なんで直らないの？　PDFを作った方か、Adobeのソフトか、どっちが悪いの？
- Re:文字化け (スコア:2, 興味深い)
  
  by Anonymous Coward on 2023年01月06日 10時16分 (#4390169)
  
  一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
  そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。
  各文字は文字コードではなく、フォント内のグリフ番号で指定されています。
  そのまま印刷するのは問題ありませんが、別ソフトで読み込む場合などには、元のテキストを復元する必要があります。
  しかしながら、情報が失われていて元のテキストを復元できないケースが往々にしてあります。
  正直、PDFはデータ交換用には向いていないファイル形式だと思うんですよね……。
  ファイル構造を調べてみると、あまりのゴタマゼ具合に眩暈がするほど。
  （歴史のあるフォーマットなので、屋上屋を重ねすぎてカオスです。ほんとに）
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ポータブルなのに…
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
    IllustratorやInDesign上でテキストを含めた全てをアウトライン化して、PDF化して入稿すれば良い話じゃないんですか?
    そもそもプリフライトチェッカーをかけたときに指摘が入ってるんじゃないでしょうか。
    技術的な意味でPDF入稿にテクニカルな問題や躓きポイントがある指摘は同意しますが、2010年中盤からは多くの印刷がPDF入稿であり、印刷所側も細かく対応してると思いますけどね。
    自分はもうここ何年も印刷・入稿した事がないので、最近の事情が違ってたらすいませんが。
    - Re:文字化け (スコア:2)
      
      by bubu-duke (47248) on 2023年01月06日 13時47分 (#4390295)
      
      現役デザイナーです。今はPDF入稿か未アウトラインでの入稿が多いです。
      最終の本印刷の前に印刷用データを使った色校正が入るはずですので、そこで見落としたのが一番のミスですね。
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        今はアウトライン化はしないんですね。勉強になりました。
        もし可能なら教えてほしいのですが、昔は文字ばかりの文庫本とかを除くと基本的にアウトライン化は必須だった記憶があるんですが
        今はアウトライン化をしない理由って何なんですかね。容量の問題とかですか? それともアウトライン化によって別の不具合や依存等が発生するんですか?
        
        Re:文字化け (スコア:3)
        
        by bubu-duke (47248) on 2023年01月06日 20時47分 (#4390571)
        
        モリサワパスポートなどの普及で、書体のバージョン違いのトラブルが減ったことと、ご指摘の通り容量の問題だと思います。
        PDF入稿でしたらほぼ確実にフォントがPDFに埋め込まれますのでなおさらかと。
        またアウトラインを取ることによって文字が太く見えてしまうことも原因だと感じています。
        
        シェア
        
        親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。
    そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。
    私のお墓の前で泣かないでくださいそこに私はいません・・・みたいな感じなのか
- Re:文字化け (スコア:1)
  
  by Anonymous Coward on 2023年01月06日 9時20分 (#4390146)
  
  文字コードも言語と同じくまた沼なのです。
  　
  その沼に果敢にチャレンジし、そして力尽きて沈んでいった連載がこちら：
  小形克宏の「文字の海、ビットの舟」 [impress.co.jp]
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  というか、文字化けなら何故漢字は文字化けしてないの？って疑問があるんだが。
  括弧内だけ文字化けするなんてどんな状況だよ。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    括弧内だけフォントが違うと想像
- Re: (スコア:0)
  
  by Anonymous Coward
  
  イラレがpdfの埋め込みフォントを破棄するから。
  イラレの仕様。つまり、イラレを使う側が理解して対処しなければならない。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  そもそもPDFは各種のプログラムで読み込んで修正を加えることの出来るフォーマットという認識が常態化しているので、どんなトラブルが起きてもおかしくはない（adobeも例外では無い）
  ＃jpegとかpngとかgifとかtiffとか画像ファイル化したものをPDFに変換すればいいんですよ
言語沼だけに (スコア:0)

by Anonymous Coward on 2023年01月06日 9時07分 (#4390136)

そういう言語、という開き直りはさすがにできなかったか。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  何はともあれ、宣伝としては大成功なんじゃないかしら。
角回って、 (スコア:0)

by Anonymous Coward on 2023年01月06日 10時34分 (#4390174)

次に力士の名前が出てくるから角界の typo かと思ったが、technical term [wikipedia.org] があるのね、それも言語に関係するのが。
関連リンク (スコア:0)

by Anonymous Coward on 2023年01月06日 11時23分 (#4390205)

お、再現できた [twitter.com]
読者みんなが (スコア:0)

by Anonymous Coward on 2023年01月06日 11時28分 (#4390207)

ひんたぼ語のカルチャーセンターに通えば解決。
＃どうやら完全なシーザー暗号でもなさそうだけどね
既に買った人には訂正表載せて終わり？ (スコア:0)

by Anonymous Coward on 2023年01月06日 17時02分 (#4390436)

http://www.asa21.com/news/n50730.html [asa21.com]
ご購入いただきました皆様におかれましては、ご迷惑をおかけし、誠に申し訳ございません。
以下訂正して、お詫び申し上げます。
発売延期するような酷い誤植やらかして、既に買った人に対しては訂正表載せて終わりってことなの？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  こういうはっちゃけたtypo版は逆に価値が上がりそう。スラドとは違って。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  1月10日発売予定なのに、ご購入いただきました皆様は存在するの？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  著者のYouTubeチャンネルによると、
  誤植版は一部オンライン書店で先行販売されたもので、購入した人には後日訂正版を送付または返金対応。
  訂正版発売もトピックでは1/24となっているがその後さらに延期が決定し現時点では発売日未定。
  また当該出版社からは訂正版一刷までとし、以降は版権を引き上げて別の出版社から出版予定とのこと。
重力語 (スコア:0)

by Anonymous Coward on 2023年01月06日 17時16分 (#4390447)

ツデローヘデームベドーン
ヂッハベ
ドッフルギャンガﾌﾌﾌﾌﾌﾌﾌﾌ
とかの類かも

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

「ディスコード」→「ヅァシヶョデ」などの謎誤植で書籍が発売延期に More ログイン

再現方法と原因 (スコア:3, 参考になる)

Re:再現方法と原因 (スコア:5, 興味深い)

Re:再現方法と原因 (スコア:5, 参考になる)

Re:再現方法と原因 (スコア:2)

Re: (スコア:0)

Re:再現方法と原因 (スコア:2)

似たような事案 (スコア:2, 興味深い)

ドラクエIIの (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

真言とか呪言とか (スコア:1)

規則性が分からん (スコア:0)

Re: (スコア:0)

Re:規則性が分からん (スコア:2, 興味深い)

Re:規則性が分からん (スコア:1)

Re:規則性が分からん (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:規則性が分からん (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

つまりこういう事ですね？ (スコア:0)

Re: (スコア:0)

文字化け (スコア:0)

Re:文字化け (スコア:2, 興味深い)

Re: (スコア:0)

Re: (スコア:0)

Re:文字化け (スコア:2)

Re: (スコア:0)

Re:文字化け (スコア:3)

Re: (スコア:0)

Re:文字化け (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

言語沼だけに (スコア:0)

Re: (スコア:0)

角回って、 (スコア:0)

関連リンク (スコア:0)

読者みんなが (スコア:0)

既に買った人には訂正表載せて終わり？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

重力語 (スコア:0)