Flash(swf)もGoogleやYahoo!で検索できるように 17
ストーリー by nabeshin
検索誘導で忌避されることがなくなると 部門より
検索誘導で忌避されることがなくなると 部門より
米Adobe Systemsは、検索サービスにおいてFlashファイルも検索できるようにするため、GoogleとYahoo!に協力していることを発表した(ニュースリリース)。Googleはすでに対応しており、Yahoo!は将来のエンジンのアップデートで対応することになるとのこと。リリース文ではLive Searchには言及されていないので、マイクロソフトとは何もしていないと思われる。
Flashファイル(swf)から検索インデックスを生成できるということだが、テキスト情報として残っているものとして何があるのだろうか。たとえば、Flareを使えばActionScriptを抽出したり、swftoolsを使えばテキストなども抽出できるので、これまでもやろうと思えばできたことではある。アドビが協力していることで、精度が高い(実態はPlayerやswfジェネレータのバグ潰しだった?)といったところだろうか。Googleについては以前から「filetype:swf」などとして検索できていたが、今回の発表に合わせてか公式ブログでQAも公開されている。
Flashファイルが標準で検索できるようになると、サイト作りも大きくかわるかもしれない。検索にあわせてテキストを埋めたFlashの作り方の必要や、これまで以上にFlashの積極活用が起こりそうだ。ページ全面がFlashというサイトも増えるかも。
ほんとだ (スコア:5, 参考になる)
公式ブログのQAによると、
Q: どーやってFlashの中をみているのですか
私たちは人間がボタンを押したり入力するのと同じような方法でFlashファイル内を探索するアルゴリズムを開発しました。云々
とあるので、デコンパイルでテキスト抜き出すというより(の前に?)、ある程度の操作はエミュレートして、表示される(レイヤーに書かれている)テキストを拾っているのでしょう。
そうしないと、不透明のレイヤーを上にかぶせただけで非公開の(つもりの)テキストもばんばん検索当たって困りますわな。
ついでにQAで上がっている注意点としては、
1. ある種のJavaScriptと一緒に動作するFlashは一部拾えてないよ
2. Flashから取り込んでいる外部リソース(HTML、XML、SWF)は拾えてないよ(一応拾っているけど別物としてインデックスされる)
3. 右から書く言語(ヘブライ語とアラビア語)はまだ非対応
らしいです。
テキストの重みは? (スコア:3, 興味深い)
僕が懸念するのは、これらの情報が、HTMLのようにマークアップされてないことです。テキストに対する重みはどうやってつけるかってことで。
すべてが一律に扱われるということは、やっぱりSEOには向いてないということだし、逆にSEOで汚染される恐れもないということなのかなぁと。
増えそうなサイト例 (スコア:2, 興味深い)
Re: (スコア:0)
flashでのサイト作成方法よりこういう表現が理解できるかの方が。
Re:増えそうなサイト例 (スコア:3, すばらしい洞察)
以下、オフトピ。
世の中の Web デザイナーさん達にお願いしたいのですが、芸術作品のようにどのように見せるのか?というデザインを競うのも悪くはないと思います。
でも、日常的に使える「工業デザイン」のようなデザインといった考え方も、頭の片隅にでも入れておいて頂けると嬉しいです。
Re:増えそうなサイト例 (スコア:1)
2分ぐらいみる気があれば、それなりにおもしろかった気がする。
Re: (スコア:0)
Flash内のテキスト検索とは関係ない気がしますが。
何か関係するのでしょうか。
Re: (スコア:0)
検索できないサイトは事実上存在しないのと同じ。
しかし今後は出るので、Flashで作ることが出来るようになった。
危惧 (スコア:2, 興味深い)
検索のためよりは、ブラウザの互換性のために作っているところが多いとは思いますが、
見直しのきっかけにはなりそうな気がします……
Flashは、重いということもあるけど、
むしろ、必要な情報にたどり着くまでに無意味なエフェクトを見なきゃいけないのが、
どうも好きになれないのです。
たかだか数秒の違いっていえばそうなんですけど。
私の脳が時代遅れなんですかねぇ?
Re:危惧 (スコア:2, 興味深い)
効かないから、見づらくてもどうしようもないというのが難儀なこと。
Flashを使うのは、ゲームとかルパン三世風タイトルメーカーとか
のような、エフェクトそのものに意義がある場合だけにして欲しい。
OpenLaszloに朗報ですな (スコア:1)
HTML5の時代は来ない宣言ですかぁ? (スコア:0)
Flash使えなければWebデザイナにあらず、スクリプト組めなければWebコーダにあらずの時代にはもうなってますけれど。
HTML5+CSS3+Javascript2+APNGも忘れないでください [zdnet.com]
#Flash嫌いじゃないんですけどね、サイズがでかくて重い。
#IE6以前よそろそろなくなれ。と思うAC
あれ? (スコア:0)
ゲッペルスで検索すると宣伝相に怒られた [neweb.ne.jp]記憶があるけどなぁ。
Google先生 (スコア:0)
なんか最近Googleで検索した語が、キャッシュで表示されるページのどこにもないって事態に遭遇するんだけど。実ページを見れば確かにあるので、キャッシュが不完全というか、内部データが同期できていないというかそんな感じ。Google先生、大丈夫?
最近? (スコア:0)
Googleはそのページ内の文章だけではなくて、そのページにリンクしている
リンク元のページ内文章もインデックスとして利用していたはずです。
だから、こっちのコメント [srad.jp]にある「ゲッペルス」も、
リンク付で「ゲッペルスについての面白いフラッシュ見つけたyo」みたいな紹介サイトが大量にあると、
Googleは「これは『ゲッペルス』についてのページだ。しかも被リンク数が多い」と判断して
ページ内にその検索語句が無くてもランクは上位になります。
(だってその方がいちいち紹介サイトを経由しなくて済んで便利でしょ?)。
#SEOについての文章でどこかで見かけたけどソース見つけられないのでAC.
Re:最近? (スコア:1)
> ページ内にその検索語句が無くてもランクは上位に
そういうことをしているから、「18歳未満」でググると [google.co.jp] Yahoo! JAPAN がトップに来るようになっちゃってるわけですね。
検索対応 (スコア:0)
こんなのMacromedia Flash8の頃から常識的な機能なんですけど…
そんなことも知らないで記事書いてるのかな?