アカウント名:
パスワード:
OCRソフトって、ただ似ている字形をコード化してるだけなの? アルファベットの大文字小文字もけっこう上手に認識してたけど、日本語は辞書とか使って正しそうな文章を推定したりしてないの?
例えばこのファイル [fukushima.jp]は画像だけのPDFのように見えるけど、googleの検索結果 [google.co.jp]では文字が表示されるので、googleが勝手にテキスト化しているだけのように思えます。
すみません。元記事よく読まなかったので忘れてください。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
Stay hungry, Stay foolish. -- Steven Paul Jobs
辞書使わないの? (スコア:0)
OCRソフトって、ただ似ている字形をコード化してるだけなの? アルファベットの大文字小文字もけっこう上手に認識してたけど、日本語は辞書とか使って正しそうな文章を推定したりしてないの?
犯人はgoogle? (スコア:0)
例えばこのファイル [fukushima.jp]は画像だけのPDFのように見えるけど、
googleの検索結果 [google.co.jp]では文字が表示されるので、
googleが勝手にテキスト化しているだけのように思えます。
Re: (スコア:0)
すみません。元記事よく読まなかったので忘れてください。