Googleが「日本語検索の品質向上」に向けた検索アルゴリズム改善を行う 50
ストーリー by headless
改善 部門より
改善 部門より
hylom 曰く、
Googleが今週、日本語検索の品質向上に向けた改善を行ったそうだ(Google ウェブマスター向け公式ブログの記事、 ITmedia NEWSの記事)。
昨年は健康・医療情報サイトが不適切な記事を多数公開し、SEOによって多くの閲覧者を集めていたことが問題となった。この余波で複数の「キュレーションサイト」が相次いで記事の公開を中止している。こういった「低品質」なサイトが増えている理由の1つに、Google検索への最適化を行うことで低品質なコンテンツでも閲覧者を集めることができていたことがあった。
Googleは「検索結果のより上位に自ページを表示させることに主眼を置く、品質の低いサイトの順位が下がります」としているが、具体的な変更内容の説明はない。ITmediaの記事では、「特定サイトの一部ページ」の評価を下げるような変更が行われたとの見方を紹介している。また、今後対象サイトが増える可能性もあるという。
アンチSEO対策は永遠の課題 (スコア:3, 参考になる)
今回の件はキュレーションメディアがたまたま騒がれた時期が近かったしそう見えるのかもしれないけど、過剰なSEOでパクリやコピペが検索上位に来るというのは検索エンジンとしては望ましい状況とは言えない。
イタチごっこになって久しいとは思うけど、SEOとの戦いは常に続けているんじゃないかな。
少なくとも、騒がれて問題になったから場当たり的に対処してアルゴリズムを変えているわけじゃあないと思う。
今頃SEO屋は躍起になってアルゴリズムの解析をしているんだろうなぁ……。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
「低品質なサイト」とは (スコア:2)
これってサイトに掲載される記事の正確性の話じゃないと思うんだよね。
情報じゃなくてモノで表すと、一点モノと大量生産品の違いみたいな感じじゃないかなー。
もしくは不自然にSEO対策が過剰なサイトとか。
Re:「低品質なサイト」とは (スコア:1)
いわゆるキュレーションサイトでしょ
少し前に叩かれまくったような、何の役にも立たないサイト
Re: (スコア:0)
役に立たないどころか有害
スラッシュドット・ジャパン終了のお知らせが関連リンクにあるが (スコア:2)
なぜ本チャンの記事 [slash.srad.jp]の方じゃなく直前のエイプリルフールネタの方なんだと思ったら、
エイプリルフールの方ではすらどはキュレーションサイトだと言っていた(本チャンの方ではそういう記載はない)からなのか。
細かいことが気になってしまう (スコア:1)
検索エンジンのシステムって
クローリング、インデックス作成、ユーザーのリクエストに応じて(ランキング付けしつつ)結果を表示する機能
とか複雑な仕組みになっているはずで
その中のランキングの部分をいじってるという話のようだから
「検索アルゴリズム」が改善したというのとはちょっと違うような気がする
より多くのものを検索できるようになったわけでも、より早く検索できるようになったわけでもなさそうだし
ついでにいうと
アルゴリズムの変更というのもなんか大げさで
ランキングのルール変更
という方がしっくりくる気がする
いやまあユーザーから見たとき検索の結果の出方が変更になった
それを簡潔に表現するのに「検索アルゴリズムが改善された」という表現が便利という気持ちなんでしょうけど
Re:細かいことが気になってしまう (スコア:1)
GoogleがアメリカでSEO対策(正しい用法)したときにもいつも使っている表現で、今回だけことさらに取り上げる意味もなさそうだけど。
Re: (スコア:0)
影響を受けたのが特定のサイトに限られてるということは、人力で操作してるのかな?
Re: (スコア:0)
アルゴリズム(人力)
ライブドアブログやNAVERまとめが上位に表示される問題 (スコア:1)
一番巨大かつ悪質な「まとめサイト」と言えばここよ
Re:ライブドアブログやNAVERまとめが上位に表示される問題 (スコア:1)
大丈夫だ
問題ない
https://it.srad.jp/story/17/01/24/0622218/ [it.srad.jp]
ここしばらくは大きなミスも間違いもありませんだから大丈夫です。
一週間以上遡らないと大きなミスがないのですよ。
多分ハイロムさんは適当にやってるしエキサイトニュースも適当にやってる。
ヘッドレスさんは趣味に走ってる気がする。
Re: (スコア:0)
「悪質」の定義は?
Re: (スコア:0)
「巨大」の定義は?
Re: (スコア:0)
「一番」の定義は?
Re: (スコア:0)
「ここ」ってどこ?
Re: (スコア:0)
スラド... かな。
Re: (スコア:0)
ツッコミだらけで笑った
Re: (スコア:0)
LINEがNaverまとめの著作権侵害やめないならBLOGOSへの転載とメルマガを止めようと思う
2016年12月18日
https://www.landerblue.co.jp/blog/?p=30632 [landerblue.co.jp]
こういうのね
ライブドアブログのまとめサイト問題は言うに及ばず
Re: (スコア:0)
著作権侵害に一義的に対応するのはGoogleの役目なのか?
被害を受けた側が法的措置をとりやすくするのが先だろ
Re: (スコア:0)
個別のwebサイトがドメイン以後で小分けされている形式は、
レーティングやブロック支援を行うブラウザアドオンで個別のレーティングが効かなくて困る
Re: (スコア:0)
割とこれだよなあ。
NAVERとlivedoorブログ消すだけで気持ち悪いネトウヨとまとめとか
ほとんど検索に上がらなくなる。
あとは大きくなってlivedoorから離れて独自ドメインとったとこ
数カ所表示しなくなるだけでgoogleの検索効率ずっと上がる。
そんなことよりGoogleよ、聞いてくれ (スコア:0)
音声検索後、音声での読み上げがすごく邪魔なんですが
Re:そんなことよりGoogleよ、聞いてくれ (スコア:1)
こんなところに書いても聞いてくれるわけないだろ。
https://www.google.com/tools/feedback/intl/ja/ [google.com]
もしどこに書いてもクロールした時にフィードバックとして受け取ってくれるならそれはそれですごいが。
Re: (スコア:0)
どこに書いてもクロールした時にフィードバックとして受け取ってくれるシステムの特許
どこかがとっていたりして
実現してるかどうかは別として
Re:そんなことよりGoogleよ、聞いてくれ (スコア:1)
Google先生もスラドを昔ほどクロールしてくれなくなったようで、とくに最近の投稿はググってもうまく探し出せないことがよくある。
ただしBingやDuckDuckGoはもっとひどくて、やっぱGoogle以外は使い物にならんなーと思ってしまうの健全な検索エンジン市場のためにもどうにかしてほしい
Re: (スコア:0)
クロールする価値もないってことですかね?
Re: (スコア:0)
slashdot.jpからsrad.jpへのドメイン変更で、諸々のパラメーターがリセットされたんだろう。
Re: (スコア:0)
さすがに/.がそんなリンクジュースをこぼしまくるような運用はしてないと信じたい。
ただし金次第 (スコア:0)
そんな金出す価値あるかはさておき。
アフィ (スコア:0)
まとめブログをいくつか見ると、閲覧数に連動して収入が増えるアフィ広告があるので
これを収入源にしていると推定できる。
アフィ広告をマイナス査定するだけで、閲覧数稼ぎ狙いの煽動サイトの検索順位はかなり下がるはず。
アフィ広告はAmazonや楽天がやっているから、アフィサイトの順位が下がってもGoogleは困らない。
むしろIT業界の覇権を競っているAmazonにダメージを与えられる。
アフィに限らず他の広告システムを潰せば、結局Googleが主導権を握ることができる。
Re: (スコア:0)
Googleがなんの商売をしている会社なのか知らないのだろうか。
オリジナルコンテンツ (スコア:0)
なおまとめサイトがオリジナルで、弱小個人サイトはそれをパクった品質の低いコピーだからペナルティで表示されなくなります
# ガチでこうだからなー
Re: (スコア:0)
そういや一時期は2ch.netより上に表示されてた2ch.sc、
めっきり検索結果に出てこなくなったな。
ユーザーに (スコア:0)
定期的にアンケートしてそれ参考にして調整すりゃいいのに
youtubeでにたようなのやってんじゃん
「興味ない」ボタンみたいなの設置してさ
上位に入ってるけど多くの人が必要ないって思うサイトは自然に下がってくはず
直接そのデータを利用するわけではなくあくまでも参考程度に
まあこんなんで解決するならとっくにやってそうな気もするし公平さの担保も難しいよね
爆撃で操作される可能性も考えるとやっぱり固定的なアルゴリズムが必要なのかね
俺はスクリプトで非表示にしてるけど管理もだるいし新規サイトの対応も手間
やっぱ根本的な解決をしてほしいな
Re:ユーザーに (スコア:1)
グーグルに自分の声をどう届けるかという意味で、私も同じように悩みました。
希望に一番近い既存の方法として、検索結果画面の最下部にある「フィードバックの送信」というリンクがあります。
クリックすると「問題点やご意見をご記入ください」というダイアログが出て今回の問題の意見を送るのに良さそうなのですが、下の方に「法的な理由でコンテンツの変更をリクエストする場合は、法的リクエストのヘルプページに移動してください。」とも書かれています。
キュレーションサイトが他人のコンテンツをパクっていることについてなにが問題かを考えていくと、著作権法が定める著作権を侵害している(引用の要件を満たしていない)ことに帰結してしまい、そうするとフィードバックの送信ではなく、法的リクエストのほうで対応しなくてはいけなくなってしまいます。でも私は法に基づいて相手のコンテンツを削除するような権利者ではありません。
私はこの段階で悩みましたが、悩むことをすっぱりとやめて、自分の意見を「フィードバックの送信」で送ってしまいました(^^;;
もしかしたら自分の意見を送ることでグーグルが検索順位を改めてくれるかもしれませんので、筋が悪いことは承知していますが、やってみました。
チラ裏失礼。
Re:ユーザーに (スコア:1)
検索結果のクリック数を調べることで、実質的に同等なことはやってると思いますよ>定期的なアンケート
どちらかというと、問題は多数決で「良いサイト」を決めると、パクリでも捏造でもいいから、扇動的で過激なサイトが上位にきてしまう、という点なのでは?
結果的に、現在Googleがやってることは、見かたによっては上から目線な情報の選別で、そこに変なイデオロギーが混じったり、選別が過ぎると、朝日新聞的なバッシングの対象になりかねない、とも思うんですが。
そうすると次に来るのは、Googleアカウント毎に冷静なページを好むか、扇動的なページを好むかパラメータを持たせて、検索結果を変えるようになったりするんでしょうが、そうするとますます社会の分断がすすむような。
Re: (スコア:0)
Chromeの拡張機能「Personal Blocklist (by Google)」がそれなんじゃね。
下げるんじゃなくてブロックだけど。
Google News (スコア:0)
無許可パクリコンテンツのみのサイトの典型例で、過去に既存ニュースサイトと何度もトラブルを起こしてきたわけだが、
自社の最新アルゴリズムで評価したらどうなるのっと。
#考えてみたら、Google検索も一種の「キュレーションサイト」だよな。
Re: (スコア:0)
無許可パクリコンテンツのみのサイトの典型例で、過去に既存ニュースサイトと何度もトラブルを起こしてきたわけだが、
自社の最新アルゴリズムで評価したらどうなるのっと。
#考えてみたら、Google検索も一種の「キュレーションサイト」だよな。
キュレーションの意味について考えてみよう。
Re:Google News (スコア:1)
キュレーターはAIです。
Re: (スコア:0)
今のGoogleの検索結果には、単なるヒットしたサイトへのリンクだけではなく、コトバンクで拾ってきた言葉の意味やら、Wikipediaで拾ってきたその事項についてのサマリーであったり、Googleマップで示した場所であったり、そういったものが付いてくるわけだが、そういうものはGoogleによって機械的に「キュレーションされた」情報と言えないだろうか。
Re: (スコア:0)
そもそもウェブ用語になる前のキュレーションは蔵書や所蔵物を選定して整理する程度のウェブ用語としてのキュレーションと比べれば相当に大雑把な作業を指していたのでグーグルによるウェブのインデックス作成もキュレーションと言って差し支えないでしょう。
どうでもいいけどキュレーションされるって文法的におかしいよね。ふつうクリエイションされるなんて言わないよね。
Re: (スコア:0)
各種事典の定義 [kotobank.jp]からすれば、立派にキュレーションサイトじゃないか?
IT用語としては、インターネット上の情報を収集しまとめること。または収集した情報を分類し、つなぎ合わせて新しい価値を持たせて共有することを言う。(知恵蔵2015)
情報などを特定のテーマに沿って集めること。(デジタル大辞泉)
インターネット上に無数に散らばる情報を、収集・分類・再構築し、そこに価値をもたせてネット上で共有すること。(日本大百科全書(ニッポニカ))
あなたのいう意味ってなんだ?
Re: (スコア:0)
Google検索はきれいなキュレーション、Google AdWordsはきれいな広告。あたりまえだろ言わせんな恥ずかしい。
紛らわしい広告サイトをどうにかしてくれ! (スコア:0)
12V40Aのリレーを購入したくてググったら
モ/タ口ウとか言うサイトがトップヒットした。
12v リレーの販売特集
とか出てきたので、ラッキー!といってみたが、20Aまでしか取り扱いがない。
チャットサポートで問い合わせたら、「リレー」と言うキーワードがあればヒットするように広告契約したらしい。
「searx.me」使ってみて。 (スコア:0)
1年ぐらい使ってるけど次の点で便利:
オープンソース、マルチ検索なので結果も多い、Googleにトラッキングされない(何を検索したかとか、IPとか)、JS無しで使える。
開発はGithubでしてます。
Re: (スコア:0)
書き忘れたけど、フィルタリングは案としてissuesに書いてます
そもそもの原因は (スコア:0)
何年か前に新しいサイトほど上位表示するようにしたのが原因だろ
だから他サイトの記事をリライトした薄っぺらい内容のサイトやアフィブログだらけになった
それ以前にさ (スコア:0)
セーフサーチ切ってるのにエロいの出にくくするの止めてくんないかな
最近のGoogle先生って (スコア:0)
そもそも検索ワードにピッタリな結果が出にくくなったよね
検索ワードの関連語とかを勝手に推測して的はずれだけど有名サイトの記事とか引っかかるようになって、欲しい結果が出てこなくなった