パスワードを忘れた? アカウント作成
16403555 story
アナウンス

「ディスコード」→「ヅァシヶョデ」などの謎誤植で書籍が発売延期に 47

ストーリー by nagazou
誤植 部門より

1月10日に発売予定だった書籍『言語オタクが友だちに700日間語り続けて引きずり込んだ 言語沼』が、多くの誤植発生により1月24日発売に延期になったことが話題になっている。あさ出版のサイトに掲載されている正誤表によると、誤植と正しい内容は次の通り(あさ出版ねとらぼ)。

相好(そうこう)→相好(そうごう)
本居宣長(むてえよぬよとか)→本居宣長(もとおりのりなが)
Pepper(ペッパーくん)→Pepper(ペッパー)
角回(ぉきぉあ)→角回(かくかい)
白鵬(ねきぺい)→白鵬(はくほう)
稀勢(かす)の里(こて)→稀勢(きせ)の里(さと)
Discord(ヅァシヶョデ)→Discord(ディスコード)
Slack(ショチキ)→Slack (スラック)
藤原不比等(びざろょぬびばて)→藤原不比等(ふじわらのふひと)
秋田喜美(かぽ)氏→秋田喜美(きみ)氏
UTF‐8(ヤョツァョウビウアテ)→UTF‐8(ユーティーエフエイト)

誤植の内容からPDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化けが原因ではないかという指摘も出ているようだ。しかし、それだけでは説明のつかないものもみうけられるという。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 再現方法と原因 (スコア:3, 参考になる)

    by Anonymous Coward on 2023年01月06日 11時26分 (#4390206)

    再現する方法が見つかったという話が年末に出てます

    https://twitter.com/peprintenpa/status/1607951187269287937 [twitter.com]
    > お、再現できた
    > https://pbs.twimg.com/media/FlCW8d9agAEjVz9?format=png [twimg.com]

    https://twitter.com/peprintenpa/status/1607952594194006018 [twitter.com]
    > Win10の「游ゴシック」とAdobe Fontsの「游ゴシック体 Pr6N」で合成フォントファミリーを作るとこうなる
    > (理屈はこれhttp://sysys.blog.shinobi.jp/Entry/98/)理屈はこれ http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp] )

    詳しくは上の
    http://sysys.blog.shinobi.jp/Entry/98/ [shinobi.jp]
    に書いてありますが、Adobe のソフトウェア (InDesign?) のバグが原因らしいです。

    • by yume (47405) on 2023年01月06日 13時22分 (#4390275) 日記

      うわー。これはかなり特殊な条件だなぁ。

      1. 合成フォントを使っている
      2. 合成フォントを使ったテキストにルビを振っていて、ルビのフォントを自動指定している
      3. 合成フォントの名付けルールで、ウェイトの表現に-Wnを使っている
      4. 3で出来たフォントファミリーの中に、異なるcmapのフォントが含まれる

      このうち、1.~3.まではほぼ全くおかしくない作業だけど、4.はかなりおかしいね。まぁStdとStdNを平気で混ぜるようなヤカラもいるからなぁ。

      それでも、ここまでは設計者か作業者がヘボいという話で済むけど、そのまま出版しちゃあダメだよねぇ。校正フローどうなってんの?ってなっちゃう。

      親コメント
      • by taka2 (14791) on 2023年01月06日 14時03分 (#4390305) ホームページ 日記

        「DF平成明朝体W9」などで、単体のフォント再現してますし、
        合成フォントは再現しやすいだけで原因ではないでしょう。

        ・「同じフォントのウェイト違いでcmapが異なる」ようなフォントで、ノーマル以外のウェイトを使って
        ・InDesignでルビを振り、ルビのウェイト設定が自動(無指定)だと、
        ・ルビ部分は、ノーマルウェトのcmapで取得したグリフIDで、指定ウェイトのフォントの描画を行う
        ので、文字が化ける。と。
        cmapが異なるフォントでもルビのウェイトを明示的に指定してれば化けない。

        上記のフォントは縦書きの場合のみ発生していますが、これは縦と横で別のグリフを使っていて、
        横書き用グリフはずれてないけど、後ろの方の縦書き用グリフはずれてるっぽい、と。

        で、その推測を元に再現実験したのが合成フォントの例。

        親コメント
        • by yume (47405) on 2023年01月06日 14時44分 (#4390327) 日記

          あーそっか。そうなると怖いけど、同じ条件を満たすフォントってまぁないですよね(あったら怖いな)。
          うろ覚えだけど、かなり昔(os9とかのころ)のDF平成明朝体ってW9だけなんか扱いが違った記憶がある(ファミリーから外れてるとかそんな印象)けど、あれ関係あるのかな。今販売してるのは流石に大丈夫なのかな?

          親コメント
      • by Anonymous Coward

        「校正」としているプロセスの後でこれが発生したらツラいのでは。実物見られないけどルビ部分で時々発生してるやつなんだよね?

        # 相好はそうこうだと思ってましたすいません

        • by yume (47405) on 2023年01月06日 14時30分 (#4390321) 日記

          それはその通りで、@peprintenpa氏曰く、「一部のフォントの組み合わせによっては、ファイルを開いただけで文字化けが発生するパターンもありうる」ということもあり(極めて稀に稀を重ねた条件ではあるものの)、そうなると危険度は爆発的に上がりますね。

          具体的には:
          A. 作業者の念校まで一貫した環境からinddファイルを受け渡し、突然別の環境から入稿用PDFを作る
          B. 製版者がinddファイルを直接入稿用として要求し、そのinddファイルから製版する
          のどちらかで、かつお互いの環境が問題を発生させる条件を満たす場合です。
          ただし、AもBも正しい工程ではないです。この場合それぞれ、Aは作業側の責任、Bは製版側の責任でしょう。(でも、いまだにPDF入稿じゃないとこあるんだよな……)

          理想的なフローでは、念校用PDF=入稿用PDFで、それがそのまま製版されるわけですから、こういった問題が作業のタイミングで発生していたとしても、出版までには至らないでしょう。

          まぁ現実的には、無茶な日程やおかしなタイミングで修正やフォントの変更が発生し、校正の工程がヌケたかずさんであったというのが一番ありえそうです。その場合バグ自体は珍しいものの、よくある話です。

          親コメント
  • by Anonymous Coward on 2023年01月06日 11時11分 (#4390196)

    https://nlab.itmedia.co.jp/nl/articles/2212/29/news097.html [itmedia.co.jp]

    この事例では「Microsoft Print to PDFで出力して提出→業者がIllustratorで読み込み」でバグったらしいですよ

  • by iwakuralain (33086) on 2023年01月06日 12時46分 (#4390250)

    もよもとを思い出した

    • by Anonymous Coward

      × もよもと
      ○ もょもと

    • by Anonymous Coward

      Iのおっ゜てのことも時々でいいから思い出してください

  • by nemui4 (20313) on 2023年01月06日 8時09分 (#4390117) 日記

    漏らしたんすかね

  • by Anonymous Coward on 2023年01月06日 8時24分 (#4390122)

    文字コードが1か2前の文字に化けているようだけど
    変わってないものもあるし
    文字列が切れている「ペッパーくん」だけは人間の入力ミス、他は何らかの処理の過程で化けた。
    現存人物の人名(ペンネーム)らしきものがいくつか見られるので、これが原因で正誤表で済ますわけにはいかなかったのかな。

    • by Anonymous Coward

      アホなエンジニアが計算ミスで文字コード表の座標を間違えただけ? と気づいたが
      (バギーに書き捨てコード作る自分もその手のアホをよくやらかすので境界判定と双頭w)

      拗音の「ょ」「ョ」が「ら」「ラ」になってる以外に長音「-」に化けてるのも
      あるのが謎なのよね

      • by Anonymous Coward on 2023年01月06日 9時02分 (#4390128)

        本当にPDFから変換したのならありうる話であほなエンジニアが計算ミスしたわけではない。
        PDF内の文字コード(?)はフォントの位置を示しているのでその位置から文字コードを逆算しなければいけない。(文字コードそのままの時もあってその時は問題が少ない)
        その場合、変換表がPDF内にあればいいけどない物もある。無くてもそれが既知の場合は何とかなる。
        変換表があったとしてもその変換表が実際と違うこともある。一つのフォントに複数の文字コードが対応していて変換表は最初の文字と結びついていても実際は2番目の文字ということもある。
        本当にPDFからIllustratorならAdobe頑張れと思うと同時に自分が作った変換ソフトがダメダメでもまあいいかと安心する。

        親コメント
        • by Anonymous Coward on 2023年01月06日 11時43分 (#4390216)

          どこにレスをつけるか迷ったけど、とりあえずわかってそうなここに。

          「グリフコード」と「文字コード」の変換表のはなしだよね。
          基本的な(得に欧米とかの)フォントだと「グリフコード」と「文字コード」が一致しているので問題がおきないけど、日本語とかで使われるCIDフォントではこの二つは一致していないため変換表が必要になる。

          PDFの作り方にもよるけど印刷用の最終PDFの場合はこの変換表をPDFに埋め込まずにグリフコード直で埋め込む場合もある(これをやるとコピペとかが文字化けするんだけど印刷用なら問題なし)

          そういう処理をしたやつを再編集して、後から別のフォントに置き換えると文字化けが起こる(フォントによってグリフコードは異なるので)。今回は主に振り仮名で発生しているみたいなので、印刷用PDFを再編集して振り仮名のフォントを別のみ変更したんじゃないかな?

          親コメント
          • by Anonymous Coward on 2023年01月06日 19時32分 (#4390539)

            ときどき話題になる康煕部首混入問題もこれが原因(Adobe Japan-1では康煕部首と通常の漢字に同じCIDを使っているので逆変換がうまくいかないことがある)。

            親コメント
        • by Anonymous Coward

          当時Photoshopがサブスクになったのが嫌で
          CS2や6.0を無理やりインストした時もフォント周り以外は動作できた
          Adobeはフォント周りが弱い

          • by Anonymous Coward
            > Adobeはフォント周りが弱い
            羽生九段は振り飛車が苦手
            みたいな話やな
            日本のベンダがAdobeの半分でもフォントに強ければよかったのにね
      • by Anonymous Coward on 2023年01月06日 9時22分 (#4390147)

        半角カナと全角カナが混在していて、
        「ョ」(e383a7) → 「ラ」(e383a9)
        「ョ」(efbdae) → 「ー」(efbdb0)
        となってるのかな?

        長音だけ半角にしていることを説明できる理由が思いつかないけど

        親コメント
      • by Anonymous Coward

        これが文字コード変換のミスなら出版社が使ってるソフトの問題ということでは…

    • by Anonymous Coward

      たぶん全体的にUTF-8の表で2文字前になってしまってる。
      ペッパーくんは不思議ですねぇ・・・

    • by Anonymous Coward

      ShiftJIS→UTF8/16の変換ライブラリのどれかで、似たような形の別の文字に変換される事例がありますね。
      どういうロジックでそうなるのかは知らんけど。

  • by Anonymous Coward on 2023年01月06日 8時33分 (#4390123)

    スラドが書籍でなくて良かった

    • by Anonymous Coward

      スラドなら許されたのに
      #書籍でもスラドなら仕方がないで・・・

  • by Anonymous Coward on 2023年01月06日 9時06分 (#4390134)

    PDF出力したファイルをIllustratorなどAdobeソフトで開いた際に起こる文字化け

    って有名な事象のようですが、なんで直らないの? PDFを作った方か、Adobeのソフトか、どっちが悪いの?

    • Re:文字化け (スコア:2, 興味深い)

      by Anonymous Coward on 2023年01月06日 10時16分 (#4390169)

      一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。

      そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。
      各文字は文字コードではなく、フォント内のグリフ番号で指定されています。
      そのまま印刷するのは問題ありませんが、別ソフトで読み込む場合などには、元のテキストを復元する必要があります。
      しかしながら、情報が失われていて元のテキストを復元できないケースが往々にしてあります。

      正直、PDFはデータ交換用には向いていないファイル形式だと思うんですよね……。
      ファイル構造を調べてみると、あまりのゴタマゼ具合に眩暈がするほど。
      (歴史のあるフォーマットなので、屋上屋を重ねすぎてカオスです。ほんとに)

      親コメント
      • by Anonymous Coward

        ポータブルなのに…

      • by Anonymous Coward

        一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。

        IllustratorやInDesign上でテキストを含めた全てをアウトライン化して、PDF化して入稿すれば良い話じゃないんですか?
        そもそもプリフライトチェッカーをかけたときに指摘が入ってるんじゃないでしょうか。

        技術的な意味でPDF入稿にテクニカルな問題や躓きポイントがある指摘は同意しますが、2010年中盤からは多くの印刷がPDF入稿であり、印刷所側も細かく対応してると思いますけどね。
        自分はもうここ何年も印刷・入稿した事がないので、最近の事情が違ってたらすいませんが。

        • by bubu-duke (47248) on 2023年01月06日 13時47分 (#4390295)
          現役デザイナーです。今はPDF入稿か未アウトラインでの入稿が多いです。
          最終の本印刷の前に印刷用データを使った色校正が入るはずですので、そこで見落としたのが一番のミスですね。
          親コメント
          • by Anonymous Coward

            今はアウトライン化はしないんですね。勉強になりました。
            もし可能なら教えてほしいのですが、昔は文字ばかりの文庫本とかを除くと基本的にアウトライン化は必須だった記憶があるんですが
            今はアウトライン化をしない理由って何なんですかね。容量の問題とかですか? それともアウトライン化によって別の不具合や依存等が発生するんですか?

            • by bubu-duke (47248) on 2023年01月06日 20時47分 (#4390571)
              モリサワパスポートなどの普及で、書体のバージョン違いのトラブルが減ったことと、ご指摘の通り容量の問題だと思います。
              PDF入稿でしたらほぼ確実にフォントがPDFに埋め込まれますのでなおさらかと。
              またアウトラインを取ることによって文字が太く見えてしまうことも原因だと感じています。
              親コメント
      • by Anonymous Coward

        一番の問題は「PDFを作った方」でも「Adobeのソフト」でもなく、「PDFで渡したから」ではないかと。

        そもそも、PDFは最終出力を目的としたファイル形式なので、その中に元のテキストは含まれません。

        私のお墓の前で 泣かないでください そこに私はいません・・・みたいな感じなのか

    • by Anonymous Coward on 2023年01月06日 9時20分 (#4390146)

      文字コードも言語と同じくまた沼なのです。
       
      その沼に果敢にチャレンジし、そして力尽きて沈んでいった連載がこちら:
      小形克宏の「文字の海、ビットの舟」 [impress.co.jp]

      親コメント
    • by Anonymous Coward

      というか、文字化けなら何故漢字は文字化けしてないの?って疑問があるんだが。
      括弧内だけ文字化けするなんてどんな状況だよ。

      • by Anonymous Coward

        括弧内だけフォントが違うと想像

    • by Anonymous Coward

      イラレがpdfの埋め込みフォントを破棄するから。
      イラレの仕様。つまり、イラレを使う側が理解して対処しなければならない。

    • by Anonymous Coward

      そもそもPDFは各種のプログラムで読み込んで修正を加えることの出来るフォーマットという認識が常態化しているので、どんなトラブルが起きてもおかしくはない(adobeも例外では無い)
      #jpegとかpngとかgifとかtiffとか画像ファイル化したものをPDFに変換すればいいんですよ

  • by Anonymous Coward on 2023年01月06日 9時07分 (#4390136)

    そういう言語、という開き直りはさすがにできなかったか。

    • by Anonymous Coward

      何はともあれ、宣伝としては大成功なんじゃないかしら。

  • by Anonymous Coward on 2023年01月06日 10時34分 (#4390174)

    次に力士の名前が出てくるから角界の typo かと思ったが、technical term [wikipedia.org] があるのね、それも言語に関係するのが。

  • by Anonymous Coward on 2023年01月06日 11時23分 (#4390205)

    お、再現できた [twitter.com]

  • by Anonymous Coward on 2023年01月06日 11時28分 (#4390207)

    ひんたぼ語のカルチャーセンターに通えば解決。
    #どうやら完全なシーザー暗号でもなさそうだけどね

  • by Anonymous Coward on 2023年01月06日 17時02分 (#4390436)

    http://www.asa21.com/news/n50730.html [asa21.com]

    ご購入いただきました皆様におかれましては、ご迷惑をおかけし、誠に申し訳ございません。

    以下訂正して、お詫び申し上げます。

    発売延期するような酷い誤植やらかして、既に買った人に対しては訂正表載せて終わりってことなの?

    • by Anonymous Coward

      こういうはっちゃけたtypo版は逆に価値が上がりそう。スラドとは違って。

    • by Anonymous Coward
      1月10日発売予定なのに、ご購入いただきました皆様は存在するの?
    • by Anonymous Coward

      著者のYouTubeチャンネルによると、
      誤植版は一部オンライン書店で先行販売されたもので、購入した人には後日訂正版を送付または返金対応。
      訂正版発売もトピックでは1/24となっているがその後さらに延期が決定し現時点では発売日未定。
      また当該出版社からは訂正版一刷までとし、以降は版権を引き上げて別の出版社から出版予定とのこと。

  • by Anonymous Coward on 2023年01月06日 17時16分 (#4390447)

    ツデローヘデームベドーン
    ヂッハベ
    ドッフルギャンガフフフフフフフフ

    とかの類かも

typodupeerror

アレゲは一日にしてならず -- アレゲ見習い

読み込み中...