パスワードを忘れた? アカウント作成
14266012 story
データベース

国会図書館、年間納本数の約5%弱しか電子化能力がないことが判明 63

ストーリー by nagazou
今ならDTPデータと見本誌一冊提供にできそうな気がする 部門より
参議院議員の山田太郎氏のブログによると、国内の出版物の保存を行う国会図書館の電子化能力は、毎年納本される納本件数43万(図書17万点、雑誌26万点)点中約2万点ほどで、年間納本数全体の5%弱しかないという(山田太郎)。

現状の予算2.3億円では、この約2万点が処理能力の限界であるようだ。国会図書館内の蔵書で1968年以前に発刊された書籍等1240万点のうち、電子化されているものは244万点。デジタル化率は20%ほどしかないという。

同議員は

私は、必要な書籍が広く電子化され、特に研究・教育目的で活用しやすい形で書籍データを提供できていること、国会図書館内では、納品されている書籍は全て全文検索を行うことができ、必要な情報を素早く取出すことが出来るようにすることが、今の時代の国会図書館のあるべき姿だと思います。

としている。同議員によれば、2000年までに刊行された出版物をすべて電子化する場合、年間207億円の予算が追加で必要となるとしている。

  • by Anonymous Coward on 2020年08月14日 7時21分 (#3870010)

    新規に納本させるときは現物と電子化データの両方を提出させればいい

    ここに返信
    • by Anonymous Coward

      いや本当に電子データ納品にもっと早く切り替えないとですよね

      • by Anonymous Coward

        中身が電子書籍版で欠けてたりして……

        • by Anonymous Coward

          18禁の漫画ではよくある話ですね

        • by Anonymous Coward

          電子版は袋とじ漫画が掲載されなかったり
          芸能人が黒塗りされたりするからな

          • by Anonymous Coward

            袋とじがないとか、黒塗りとかは、印刷用の電子データから、配信用に再加工したもんだよね。
            出版側が持ってる印刷用のデータなら、紙のものと同じはず。

            ePubとかPDFとかで、袋綴じをどう扱うのかは謎だけど。

            • by Anonymous Coward

              そうだよね。現在の書籍で電子化(電子書籍という意味ではない)されてないものなんてゼロじゃないの。
              印刷寸前のデータ(も)納本?してください。あなたの出版物の永久的な記録にもなりますよ。お願いします。

        • by Anonymous Coward

          欠けてはいないが、全ページ画像ファイルだったり?

    • by Anonymous Coward

      年間43万冊ってことは、24/7で処理したとしても、毎分約0.8冊のペースで電子化しなきゃならんってことだ。
      そんなん、「何々の本を受け取りました」ってデータベースに入力するだけでも時間が足りないわw
      いくつも並列で処理できる専用の作業設備でも作って大量の人員を投入しないことには無理よなw

      電子データでの納本が現実解やね。

      しかし、年間43万冊も納本されて、ほんとに全部保管してるの?
      毎年1階ずつ地下を掘り下げてるんかいな。

      • by Anonymous Coward

        肝となるのは自動化だよね

      • by Anonymous Coward

        データベースに入力するだけでも時間が足りないって?
        さすがにシーケンシャルじゃなくて並列に処理するだろ。
        毎分0.8冊ずつ入力する必要なんかないよ。意味のない割り算されても。

        • by Anonymous Coward

          毎分0.8冊ってのは24/7フルタイムで働いたとしての話。実際はもっと過酷だ。

    • by Anonymous Coward

      印刷所への納品データをそのまま収めるとか? ファイルばらばらだったり、トンボ入ってたりするけど。

  • なんで一冊1万円以上かかるんだよ?どんな値段のサービス使ってんだ?
    ここに返信
    • by Anonymous Coward on 2020年08月14日 21時17分 (#3870525)

      自炊してみればわかりるけど、断裁してADFに食わせた場合ですら、
      結構な手間ですよ。ScanSnap なんかを使っていたら、知らない間に重送が
      起こっているというのはほぼないけど、複合機のADFなんかは
      重送をまともに検知してくれないこともしばしば。

      重送が発生すると原稿がぐちゃぐちゃになるので、重送が発生しないよう
      あらかじめ紙がちゃんとばらばらになっているかチェックしようとすると
      かなり手間がかかる。

      重送が発生しなくても傾きなんかは発生したりするので、そのチェックは
      やっぱり手間がかかる。

      そんなこんなで、200ページ程度の本を自炊するには、雑にやっても
      1冊あたり15分くらいはかかる(スキャン自体は5分もあれば済むのだけど)。

      況んや国会図書館では、本を断裁してスキャンなんて乱暴なことはできないわけで。

  • by Anonymous Coward on 2020年08月14日 7時27分 (#3870011)

    お仕事ありましたよ!

    ここに返信
    • by Anonymous Coward

      予算の限界だって書いてあるじゃん

      • by Anonymous Coward

        マスク配布(予算466億円)や持続化給付金事業(769億+追加850億)の規模を考えたら、
        たかが「207憶x数年?」を予算化しないのがちょっとおかしな気がしてくる…。

        …というか、持続化給付金の受給者は、仕事が出来なくて困っているわけだから、
        電子化事業の参加を支給要件に加えても、大きな問題はないんじゃないの…?

        • by Anonymous Coward on 2020年08月14日 12時48分 (#3870151)

          コロナ禍での外出抑制の結果、電子図書館利用者数が前年比5.3倍になっている [sankeibiz.jp]。

          先ず、図書館の経済効果の算出方法として、「貸し出した書籍の市場価格に相当する金額を生み出した(サービスを提供した)」、
          という考え方があり、仮に1冊平均500円とすれば、6.5億冊の貸し出しで、3,250憶円の経済効果を生み出している計算になる。
          ※上記は諸々を考慮してない雑な計算なので、詳しく知りたい人はこういう資料 [ndl.go.jp]を見て下さい。

          国内の図書館は、年間で6.5億冊を貸し出しされており(※)、
          それらが電子化されると、返却待ちの発生(経済効果としてはサービスを利用できないだけでなく交通費が
          無駄になった形になる)がなくなるだけでなく、外出抑制時には、通常時より 5倍の経済効果が見込めることになる。
          ※登録利用者数計3300万なので、利用者は年平均20冊借りていることになる。

          すると、図書館の書籍の電子化は、仮に1冊平均500円とすれば、なんと 1.6兆もの経済効果に相当することになる。
          なので、受給者による電子書籍化への従事が実現すれば、ウィズコロナでも経済にメリットを
          もたらすことができる、という、とてもよい好事例になるでしょう。

        • by Anonymous Coward

          > たかが「207憶x数年?」を予算化しないのがちょっとおかしな気がしてくる…。

          そういう案件があらゆる産業、あらゆる分野においてごまんとあるんでしょ
          「1日あたりコーヒー一杯分の費用と10分の時間でこれができるのに、なぜやらないんですか?」ってのと同じ

        • by Anonymous Coward

          政府が使う金額だけで、判断しようとするからおかしくな発想になるんですよ。
          マスク配布しなかった場合、持続化給付金を出さなかった場合の損害がどうなるのか。
          経済的な面だけじゃなくね。

          書籍の電子化にお金いれて、入れたぶんの何倍の経済効果が期待できるんですかね?

          • by Anonymous Coward

            > 何倍の経済効果が期待できる

            こちら [srad.jp]をどうぞ。
            毎年207憶の投資に対して、毎年1.6兆(16,250憶)の経済効果が生まれる可能性があります。
            皮算用で78.5倍ですね。細かい検討はあるでしょうが、ベースデータは事実に基づくので、
            最低でも10倍~の効果が見込めるでしょう。

  • by Anonymous Coward on 2020年08月14日 8時15分 (#3870019)

    電子化したらあの正面玄関のパソコンで見れるんだっけ?
    ネット経由で見れたりするなら便利だけど、紙版と同じく国会図書館まで足を向けないといけないならあんまりメリット感じないな。
    電子化は高精度の三次元スキャンとかではないから、質感とか以前に書籍を完全に表現しきれるものではないし、当然紙媒体で保管が必要だし。
    何十年後のことを考えればもちろんやった方が良いに決まってるんだけど。

    ところで国会図書館と言えば電器屋に置いてある商品カタログって対象外なんだよね。
    あれ、産業文化の資料として極めて参考になると思うんだが、少なくとも電子納本にするなら対象にして欲しいな。
    目的からして公開の承諾も得やすいだろうし、普通に読みたいよ。
    この時代に記録保管の網から漏れて消えていく資料があるというだけで悲しい。
    まぁインターネット上の情報は割とそうだけど。

    ここに返信
    • by Anonymous Coward

      年会費5万円で閲覧用端末を貸与するサービス始めれば結構使う人はいそう

    • アレクサンドリア図書館のように、火事で燃え原本が全て失われてしまい。
      それまで誰かが写本していた部分までしか、後世の人間は読めなくなってしまった。
      などという馬鹿げた自体に陥らないよう、バックアップは可能な限り大量に作っておくべき。
      なんならgitやブロックチェーンで利用者全員が完全なコピーを持てるようにしてくれていい。

       

      「過去を忘れる者は同じことを繰り返すよう運命づけられている。」- ジョージ・サンタヤーナ

    • by Anonymous Coward

      行政書類保管の国家資格とか何日か前の読売の一面で載ってたけど、
      こんなのやらないで自治体の書類は職員のメモに至るまで全部保存できるシステム作るべきだわな
      分別なんか不要、今いらなくても何百年後は価値のある宝物になるのわかってるのにさ

    • by Anonymous Coward

      著作権切れてない奴は、現地の端末でないとみれない。

    • by Anonymous Coward

      インターネットアーカイブを出版社が訴えた先月の事件みたいなのが日本でも起きるだけじゃね

  • by Anonymous Coward on 2020年08月14日 8時33分 (#3870026)

    電子化して検索できれば、っていうけど、検索技術どうすんのさ?
    Google様に丸投げですか?
    全文検索だとゴミ結果がすごくでるけど、利用できるの?

    だいたい、原因でも予算出てないのに、データの維持管理費用まかなえないでしょ。

    ここに返信
    • by Anonymous Coward on 2020年08月14日 11時05分 (#3870094)

      収蔵、保存だけなら、そう無意味とも言えない。
      検索性はいわば、次の段階と思う。
      大掛かりな叢書 [wikipedia.org]となると、要点だけ [wikipedia.org]、いわばメタ情報の生成にも相当のコストをかけてたんだから。

      歴史的には、影印本 [wikipedia.org]という複製技術もあった。
      写真フィルムという、活字+紙による製本と違うハードウェアを利用したわけだ。

      一足飛びにGoogle並の利便性を追求しても実現性は低い。
      さて、電子化された戦史史料 [srad.jp]でも読むとするか。

    • by Anonymous Coward

      だから、書籍を電子化するなんて無理、無駄だし、そんな事考える奴は無能。
      って事?

      • by manmos (29892) on 2020年08月14日 9時26分 (#3870040) 日記

        予算が出ないから色々できない->できないなら無駄->予算出さない。

        やらない理由考えること(で予算削減)が有能と評価される無限地獄。

      • by Anonymous Coward

        で、何のために電子化したいの?

        全文検索できたとして、都合の良い文節を探して取り出すだけじゃない?
        本は1冊を読んで、その中身を身につけるとか参考にするものでしょ。

        全文検索っていうなら、行政文書の電子化と利用の方を優先した方がいいんじゃない?

        • by Anonymous Coward

          行政文書なら、公開条件の緩和と、改竄(命令)の厳罰化をお願いしたいところだ。

        • by Anonymous Coward

          都合のいい悪い記述を見つける以外に図書館使う目的はないよ

        • by Anonymous Coward

          >本は1冊を読んで、その中身を身につけるとか参考にするものでしょ。
          すごく視野の狭いコメントだねぇ。
          人によって本の読み方なんていくらでも違うでしょ。
          電子化すりゃ人工音声に読んでもらうことだってできるんですよ。

    • by Anonymous Coward

      役所自身が高度な情報技術抱えてなければ丸投げするに決まってるのだが、別にGoogle様でなくてもいいだろ。

  • by Anonymous Coward on 2020年08月14日 10時25分 (#3870067)

    山田議員の理解度はわかりませんが、仮に電子データで納本してもらったとしても、超長期(今後数十年とか数百年)のデジタルデータ保全の難しさを知らない人も多いんだろうね。
    ビューワー/検索ツールも、過去の電子フォーマット対応を維持し続けないといけないわけで。

    ここに返信
  • by Anonymous Coward on 2020年08月14日 11時25分 (#3870107)

    現時点で1台のサーバに最大どれだけの容量のストレージが繋げるんだろう?とか
    それが何セットか必要になるんだろうか?とか
    全文検索可能なら圧縮はしないんだろうか?とか
    実用的な速度で検索するならどれぐらいの主記憶が必要なんだろう?とか
    利用目的から考えそこまで必要なんだろうか?とか
    考え出すとわからないことだらけ。

    全文検索を諦めてテープライブラリかな?
    やっぱり。

    ここに返信
  • by Anonymous Coward on 2020年08月14日 12時54分 (#3870155)

    それで「すべて」が電子化可能
    無駄のアレコレ切り詰めればすぐに捻出できる額だろう

    無駄を減らせる(≠無くす)なら消費税率もまだ1桁だろうけどね

    ここに返信
    • by Anonymous Coward

      > 無駄のアレコレ切り詰めればすぐに捻出できる額だろう
      他のコメント読むと電子化なんてものは「無駄だ」ととらえている人もいるようですし,難しいと思いますよ.

      • by Anonymous Coward

        どこにもみつからないんですが、どれです?

    • by Anonymous Coward

      税金事業に予算の上限はないので、誰かが予算増やすよう動けばいいんじゃないんですかね
      家計簿感覚で税金の使い道を考えるのはやめましょう

typodupeerror

開いた括弧は必ず閉じる -- あるプログラマー

読み込み中...