アカウント名:
パスワード:
ところが、検索結果として抽出された過去記事の場合、そういった加工が施されていないだろうと推察されます。
もし電子データがもとから存在するならそう言えるけど、これは昔の紙媒体のデータを電子化するという手が加わっています。Washington Postは本体をダウンロードする前に要約を見せていて、Newsarchive.comは画像pdfとそれをOCRで読み取ったデータを見せるようです。
要約もOCRも人手じゃやってられない訳で、機械的にやるようにしていると思いますが、人手でやる時とは別のエラーが入りそうです。
というか、データがあって初めてgoogleが検索を提供できるわけで、昔の新聞のデータをいっしょうけんめい電子化している新聞社が偉いんじゃないかと思います。瓦版も電子データを作れば検索できるようになるはずです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日々是ハック也 -- あるハードコアバイナリアン
業界の自主規制は今後どうなるのだろう (スコア:2, 興味深い)
警察に連行される容疑者の映像を例にすると、昔は手錠まで映していましたが、その映像を引用する場合もボカシを入れていたりします。
過去の新聞記事を引用する場合でも、現在では差別的表現とされる文言は他の言葉に置き換えて引用してたりしますし。
表現の問題そのものを議論する際には敢えて元の素材のまま使ったりしますが、その場合でも注釈を入れるなどしています。
過去の記録を生のまま提示するのではなく、現代の報道の基準
Re:業界の自主規制は今後どうなるのだろう (スコア:2, 参考になる)
もし電子データがもとから存在するならそう言えるけど、これは昔の紙媒体のデータを電子化するという手が加わっています。Washington Postは本体をダウンロードする前に要約を見せていて、Newsarchive.comは画像pdfとそれをOCRで読み取ったデータを見せるようです。
要約もOCRも人手じゃやってられない訳で、機械的にやるようにしていると思いますが、人手でやる時とは別のエラーが入りそうです。
というか、データがあって初めてgoogleが検索を提供できるわけで、昔の新聞のデータをいっしょうけんめい電子化している新聞社が偉いんじゃないかと思います。瓦版も電子データを作れば検索できるようになるはずです。