アカウント名:
パスワード:
紛失といっても家の中での本の山に埋没して見つからなくなることだが。何百冊ものコミックをスキャンしてPDF化し、シリーズ毎にフォルダに整理しておくと、何巻あたりにあったあのシーンとかで探したくなったときも簡単に探せるのがいい。
文字が主体の本は検索性が悪くなるからスキャンする気はない。雑誌の残しておきたい記事をスキャンするくらい。(それでもエッセイとかの軽めのものが大半)
2度と読まないだろうと思う本はスキャンしても読むことはないのでそのまま捨ててしまうようになった。
> 何百冊ものコミックをスキャンしてPDF化し、シリーズ毎にフォルダに整理しておくと、> 何巻あたりにあったあのシーンとかで探したくなったときも簡単に探せるのがいい。
商業出版の物ならもう一つ買えばいいが、同人誌を解体するのは俺には無理。
> 文字が主体の本は検索性が悪くなるからスキャンする気はない。
全文検索を当てにできるほどOCRの性能がよくないのかな。入力データの問題さえ解決すれば明らかに文字が主体の本のほうが検索しやすいと思うけど
全文検索を使うときに当てにならないのは自分の記憶。検索は表記のゆらぎや類似ワードを拾い上げてくれないので、それで問題を解決するには調べたい文言を誤りなく覚えてる記憶力が必要。つまり俺には検索を使いこなすことは無理だということだ。
俺も参考書とか小説をスキャンしてOCRかけて修正してとかめんどくさすぎて漫画だけ自炊してるよ。売ってる漫画の電子書籍は低解像度で嫌なのもあって。高解像度モノクロ2階調だと綺麗だし以外とファイルサイズも抑えられる。
実際どれくらいの解像度でスキャンして、どれくらいの大きさになるんですか?また、画像フォーマットは何にしてますか?
私はジャマな書類をスキャンしたいと思ってます。 OCR は特に考えてません。マンガに使える手法なら文字ばかりの書類もきっときれいにスキャンできると期待してます。
#4151943だけど、参考に。
ブリーチの74巻目を300dpiでスキャンしたJPEGは次のような感じ。(PDFから画像を抜き出して確認)・元のサイズは11x18cm スキャンした画像は約1300x2100dot(のり付け部分をカットした分細長くなっている)・トータル230ファイル、58MB ファイルサイズは最大460KB、最少100KB(ページ調整の余白ページは40KBくらい)
300dpiだとスクリーントーンもルビも問題なし。拡大すると文字の周りなどにJPEGの圧縮ノイズがあるが、27インチのディスプレイに1ページ単位で表示する程度なら気にならない。
ちなみに、画像を縦横50%にリサイズして150dpi相当にしたら2
文字だけの小説のようなものなら16色PNGですね。
Acrobatで画像からPDFを作るとき [adobe.com]はグレースケールかカラーなので個人的にはJPEGのみを使っている。(ちなみに、白黒のコミックをカラーのJPEGで取り込んでもグレースケールとサイズはほとんど同じだった)
> Acrobat でファイルを PDF 形式に変換するときに使用される圧縮方式は、> カラー画像とグレースケール画像の場合は ZIP または JPEG 圧縮、白黒画像の> 場合は ZIP、CCITT Group 3、CCITT Group 4、JBIG2 または Run Length になります。
白黒でやるなら600dpiにするのもありかもしれない。スキャナによっては遅くてやっていられないかもしれないが。
# 使っているAcrobatはサブスクリプションになる直前のAcrobat XI(10年前のやつ)
jpegのノイズはノイズ除去できるソフトにフォルダごと放り込んで待ってるだけで解決するしね。その用途のためだけに手っ取り早くきれいに補正できる超解像ソフトを導入したよ。
モノクロ2階調ならGIFかPNGでしょ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson
紛失することががなくなるのがいい (スコア:2, 参考になる)
紛失といっても家の中での本の山に埋没して見つからなくなることだが。
何百冊ものコミックをスキャンしてPDF化し、シリーズ毎にフォルダに整理しておくと、
何巻あたりにあったあのシーンとかで探したくなったときも簡単に探せるのがいい。
文字が主体の本は検索性が悪くなるからスキャンする気はない。
雑誌の残しておきたい記事をスキャンするくらい。(それでもエッセイとかの軽めのものが大半)
2度と読まないだろうと思う本はスキャンしても読むことはないのでそのまま捨ててしまうようになった。
Re: (スコア:0)
> 何百冊ものコミックをスキャンしてPDF化し、シリーズ毎にフォルダに整理しておくと、
> 何巻あたりにあったあのシーンとかで探したくなったときも簡単に探せるのがいい。
商業出版の物ならもう一つ買えばいいが、同人誌を解体するのは俺には無理。
Re: (スコア:0)
> 文字が主体の本は検索性が悪くなるからスキャンする気はない。
全文検索を当てにできるほどOCRの性能がよくないのかな。入力データの問題さえ解決すれば明らかに文字が主体の本のほうが検索しやすいと思うけど
Re: (スコア:0)
全文検索を使うときに当てにならないのは自分の記憶。
検索は表記のゆらぎや類似ワードを拾い上げてくれないので、それで問題を解決するには調べたい文言を誤りなく覚えてる記憶力が必要。
つまり俺には検索を使いこなすことは無理だということだ。
Re: (スコア:0)
俺も参考書とか小説をスキャンしてOCRかけて修正してとかめんどくさすぎて漫画だけ自炊してるよ。
売ってる漫画の電子書籍は低解像度で嫌なのもあって。
高解像度モノクロ2階調だと綺麗だし以外とファイルサイズも抑えられる。
Re: (スコア:0)
実際どれくらいの解像度でスキャンして、どれくらいの大きさになるんですか?
また、画像フォーマットは何にしてますか?
私はジャマな書類をスキャンしたいと思ってます。 OCR は特に考えてません。
マンガに使える手法なら文字ばかりの書類もきっときれいにスキャンできると期待してます。
Re: (スコア:0)
#4151943だけど、参考に。
ブリーチの74巻目を300dpiでスキャンしたJPEGは次のような感じ。(PDFから画像を抜き出して確認)
・元のサイズは11x18cm
スキャンした画像は約1300x2100dot(のり付け部分をカットした分細長くなっている)
・トータル230ファイル、58MB
ファイルサイズは最大460KB、最少100KB(ページ調整の余白ページは40KBくらい)
300dpiだとスクリーントーンもルビも問題なし。
拡大すると文字の周りなどにJPEGの圧縮ノイズがあるが、27インチのディスプレイに
1ページ単位で表示する程度なら気にならない。
ちなみに、画像を縦横50%にリサイズして150dpi相当にしたら2
Re: (スコア:0)
文字だけの小説のようなものなら16色PNGですね。
Re: (スコア:0)
Acrobatで画像からPDFを作るとき [adobe.com]はグレースケールかカラーなので個人的にはJPEGのみを使っている。
(ちなみに、白黒のコミックをカラーのJPEGで取り込んでもグレースケールとサイズはほとんど同じだった)
> Acrobat でファイルを PDF 形式に変換するときに使用される圧縮方式は、
> カラー画像とグレースケール画像の場合は ZIP または JPEG 圧縮、白黒画像の
> 場合は ZIP、CCITT Group 3、CCITT Group 4、JBIG2 または Run Length になります。
白黒でやるなら600dpiにするのもありかもしれない。
スキャナによっては遅くてやっていられないかもしれないが。
# 使っているAcrobatはサブスクリプションになる直前のAcrobat XI(10年前のやつ)
Re: (スコア:0)
jpegのノイズはノイズ除去できるソフトにフォルダごと放り込んで待ってるだけで解決するしね。
その用途のためだけに手っ取り早くきれいに補正できる超解像ソフトを導入したよ。
Re: (スコア:0)
モノクロ2階調ならGIFかPNGでしょ。