CSSで検索エンジンにひっかからない謝罪文を作ろう 54
ストーリー by hylom
これで謝罪して炎上させよう 部門より
これで謝罪して炎上させよう 部門より
Web系コード公開サイトjsdo.itにて、「CSSによるインデックスされない謝罪文」なるコードが公開されている。仕組みは単純で、CSSの「:before」や「:after」要素を駆使し、HTML内ではなくCSS内にテキストを埋め込むことで検索エンジンによるインデックス化を回避するというものだ。
検索エンジンによるインデックス化を避けるテクニックとしては、テキストを画像化してページ内に埋め込むというものが広く知られているが、こちらのほうが修正しやすい、ファイルサイズが小さいといった点でメリットがある。とはいえ、CSS内にはテキストが書かれているのでGoogleが本気を出したらインデックスされてしまいそうな気もする。
おまわりさんこの人です (スコア:5, 興味深い)
作った本人です。
例文を読むと察していただけるかと思うのですが、CSSによる「デザインとしての謝罪」、
つまり、ポーズだけで本質が伴わない謝罪を皮肉るネタというのが主眼で、
インデックスされないのはオマケだったのですが、
両方の方面で話題になってしまい作った本人も驚いています。
「インデックスされない」という謳い文句がGoogleの実装による、というのも認識しています。
ただ、Googleは結構、基本というか、セマンティックウェブに忠実だったりするので、
CSSに本文を書くような、セマンティックウェブ的な意味でのイレギュラーは、
将来的にも対応しないんじゃないかと思っていたりします。
ちなみに、ほかにもこんな案もありました。
# モデレーター権限回ってきてるのでID
Re:おまわりさんこの人です (スコア:1)
\begin{acknowledgement}
\acknowledgement1{教授の名前}
\acknowledgement2{准教授の名前}
:
\end{acknowledgement}
と書くとそれっぽい謝辞の文章に展開されるという。
# 正体バレを防ぐため上記のマクロ名はでっち上げです。
Re: (スコア:0)
二ヶ月後、新年度早々のネタに期待しとこ
メンテは面倒かもしれないけど、そこまでやるなら (スコア:4, すばらしい洞察)
<div style="top: 0; left: 0em; width: 1em; height: 16em; position: absolute;">こ い で ん</div>
<div style="top: 0; left: 1.1em; width: 1em; height: 16em; position: absolute;">う く き じ</div>
<div style="top: 0; left: 2.2em; width: 1em; height: 16em; position: absolute;">い ら ち ゃ</div>
<div style="top: 0; left: 3.3em; width: 1em; height: 16em; position: absolute;">う で ゃ ね</div>
<div style="top: 0; left: 4.4em; width: 1em; height: 16em; position: absolute;">の も う ?</div>
Re:メンテは面倒かもしれないけど、そこまでやるなら (スコア:2)
適当な WYSIWYG HTML エディターを使うとそんなコード出力しそうな気がする。
Re:メンテは面倒かもしれないけど、そこまでやるなら (スコア:1)
Amayaの時代がやってきた!、のか? [w3.org]
// それはない。
Re:メンテは面倒かもしれないけど、そこまでやるなら (スコア:2, 興味深い)
別にそこまでせんでも、空のページにajaxかなにかで謝罪文流し込むだけじゃだめなん?
Re: (スコア:0)
現状少数派だろうけど、javascript無効だと謝罪文が表示されないので・・・
Re:メンテは面倒かもしれないけど、そこまでやるなら (スコア:1)
よーしそれじゃ古えのスパイラル [srad.jp]で。
素朴な疑問 (スコア:2)
そもそも、「検索エンジンによるインデックス化を避ける」のは何故なのだろう。
KADOKAWAとか。 (スコア:2)
ありゃ,検索エンジンよけとしか思えないやり口だったし
Re: (スコア:0)
お詫び本文がPDFで、文中には「弊社」という表現のみで会社名はないというのに、
「kadokawa お詫び」でググると上位に来るというこのリアリティー。
Re:KADOKAWAとか。 (スコア:2)
結局の所,直リン除けにしかならないというw
Re: (スコア:0)
そもそもの、そもそもとして
画像やらPDFやらで謝罪文を公開するのは
検索エンジンによるインデックス化を避ける目的なんだろうか?
そんな事思いもつかないんじゃないの?と思えるような企業ばかりが
画像やらで謝罪文を公開してるような印象なんだけど。
「HTMLで適当に書くのは誠意が伝わらない。
ちゃんとキレイな明朝体でガッチリと画像にするんだ!」とか言ってそうな気がする。
Re:素朴な疑問 (スコア:1)
>画像やらPDFやらで謝罪文を公開するのは
WEB上に直接文章をアップするスキルのない人や部署がそういう文章を作成していて。
それをWEB担当部門か外部業者に渡して「これ載せといて」ってやってるだけでしょね。
あと、テキスト文書だと改変がすこぶる容易だしコピペされやすいのでなんとなくそれを避けてるのかも。
Re:素朴な疑問 (スコア:1)
>たぶん、Web向けじゃないフォーマットがあって、Web向けと共用してるだけなのかなぁとは思う。
元々はイニシエに作られた紙出力目的で運用していた文章フォーマットありきで、未だにそこから脱却できないというか
ずっとそれを使ってて、誰も作り直したり現状に合わせて仕事を再構築したいとは思わないんでしょうね。
きっと他にやるべき仕事がいっぱいあって手が回らないとかで。
Re: (スコア:0)
PDFの方は単にその会社の法的および社内手続き上の理由っつー気がする。
画像はPDFみたいな手段がなかった頃からの名残か、昔はPDFが嫌われていたからその名残じゃね。
ただ、「お知らせ」「更新履歴」欄などに謝罪文掲載の履歴を残さないのは掲載期間が終わったら消し去りたいという思惑があるからだよなー。
時間の問題 (スコア:1)
JABAが人気の頃も解析されるようになったしCCS使う人が増えたらすぐに対応されるますよ
Re: (スコア:0)
hylimメソッドかっ!
Re: (スコア:0)
アマ野球が人気?
Webフォントで (スコア:1)
先頭から文字コードが連番ーで並んでいて、
専用のWebフォントが適用されている時だけ謝罪文として「読める」って言うのはどうだろう。
これならインデックスされても意味不明だ。
Re:Webフォントで (スコア:4, 参考になる)
「絶対にコピペできない文章」ってやつですな.
http://tech.nitoyon.com/ja/blog/2012/04/20/uncopyable/ [nitoyon.com]
検索に引っかからないのは確かだけど,意味不明な文字列の並んだページが
スパムとして認識されたら困るかもしれない.
Re:Webフォントで (スコア:1)
おお、作成支援スクリプトまである。
これは便利!(?)
Re: (スコア:0)
( ̄  ̄ )ノ” ⌒*光学文字認識
http://ja.wikipedia.org/wiki/%E5%85%89%E5%AD%A6%E6%96%87%E5%AD%97%E8%A... [wikipedia.org]
Re: (スコア:0)
Googleは画像の文字認識してインデックスしているんだろうか?
ReCAPTCHAなんてやってるくらいだから、当然OCRの技術は持っているのだろうが
Re:Webフォントで (スコア:1)
本に関してはGoogole booksでやっている
http://books.google.com/intl/ja/googlebooks/screenshots.html [google.com]
リソースの問題で画像のOCRはまだしてないけどいつやりはじめてもおかしくない。
Re:Webフォントで (スコア:3, 興味深い)
「絶対にコピペできない文章」を思い出しました。
http://tech.nitoyon.com/ja/blog/2012/04/20/uncopyable/ [nitoyon.com]
表示したい文章をその都度ランダムに生成させたWebフォントと紐付けする自動化ツールがあれば、比較的簡単に運用できそうですね。
Re:Webフォントで (スコア:2, すばらしい洞察)
完全に、謝罪じゃなく追加で怒らせてる気がする・・・
Re: (スコア:0)
あまりこういうのやらんでほしいよな。
俺みたいになるべく軽くするために「Web ページで指定されたフォント スタイルを使用しない」にチェックを入れている人もいるはず。
Re: (スコア:0)
PDFだとフォントに逆変換用のマッピングが含まれていないとき意図しなくてもこういう状態になってしまうことがあるな。
Re: (スコア:0)
その結果がこれ [google.co.jp]だ
どうせコピーされる (スコア:1)
どういう対策をしても、結局はコピーなり文字起こしなりされて、しかも悪評付きで拡散する。
ウェブ検索したときに、そういうまとめブログみたいなのがトップに出てくるくらいなら、誠意を臭わせた公式発表が出るようにしたほうが得策な気がする。
Re:どうせコピーされる (スコア:1)
事の大きさにもよるけど、下手に対策して謝罪するくらいなら
いっそのこと謝罪しない方がマシなんじゃないかね。
そんな面倒なことしなくても (スコア:0)
Re:そんな面倒なことしなくても (スコア:2, 興味深い)
みんなわかってないよ。
画像謝罪メソッドのすばらしさは、「レイアウトを維持するために画像にしただけ」と言い訳できる点にあるのに。
robots.txtでは、インデックス化を避けていることが明示されてしまって、理由を問われたら苦しくなるから使われないのです。
そういう意味では、画像化手法は知れ渡ってしまって言い訳が通じなくなりつつあるので、より新しい手法が求められているのは事実。いっそ動画(独自形式)とかがいいんじゃないかな。
Re:そんな面倒なことしなくても (スコア:1)
この際森に隠すか。
某日何時何分、サービスが瞬断しましたごめんなさい。
某日何時何分、Internal Server Errorが発生しましたごめんなさい。
某日何時何分、レスポンスが30秒遅延しましたごめんなさい。
…
Re: (スコア:0)
「この謝罪文を表示するにはWindows 7でナンタラカンタラプレーヤーが必要です」とかだとそれはそれで叩かれるネタになるから、ある程度環境を選ばない手法である必要があるでしょう。
Re: (スコア:0)
普通にCEOが頭を下げる動画を流せばいいんじゃないでしょうか。
Re: (スコア:0)
それならMETAタグでNOINDEX、NOARCHIVE、NOCACHEなんかを指定するのも可
Re: (スコア:0)
robots.txtを参考にデータを収集する検索エンジン作ったら需要ありそうじゃね?
Re: (スコア:0)
すでにある…中国のヤうわなにをすくぁwせdrftgyふじこlp
HTML5 Canvas (スコア:0)
それならCanvasに曲線で文字書いてもいいんじゃないかな?
SVGでもいいな
画像認識でインデックス化されるかも?
CAPTCHA画像っぽくしとけばOK
Re: (スコア:0)
レガシー版として、テーブルタグで16ドットフォントを描くのはどうだろう…。
Re:HTML5 Canvas (スコア:2, おもしろおかしい)
謝罪文のIE6対応とかやりたくないです。
需要ありそう (スコア:0)
google除け掲示板・ブログ・SNSとか
Googleが本気を出したら (スコア:0)
画像で検索除けしてる所もOCRで読んでインデックスされてしまいそう・・・なのになぜかなかなかならないふしぎ
#同じ内容のお詫びの文章が日本法人だけ画像だった事例を数回見たことあるけど(見たことある事例はアメリカ法人と日本法人、ドイツ法人と日本法人)、お詫びの文章を検索除けするのって日本独特の風習?
Re:Googleが本気を出したら (スコア:1)
自筆の謝罪文を作成し、スキャンして、ウェッブに掲載すれば良いわけですね。
自筆なのは、誠意を見せるためです。
Re: (スコア:0)
Googleだと自筆でも人海戦術で解決するんじゃないかな。#CAPTCHA
縦読みにすればいいんじゃないかな。 (スコア:0)
Googleが本気を出したらだめかな。
村八分狙い (スコア:0)
ページ内に不要なキーワードなんかを入れまくったり、悪のSEOを使ってGoogle様に村八分にしてもらう。