パスワードを忘れた? アカウント作成
13761917 story
インターネット

SimilarWebで確認できる推測トラフィックと実際のトラフィックはかなり異なる 113

ストーリー by hylom
常識じゃなかったの 部門より

指定したWebサイトの訪問者数といったトラフィック情報を分析するサービスの1つにSimilarWebがある。SimilarWebはSEO担当者やマーケティング担当者などから重宝されているようで、最近では海賊版サイトへのブロッキングを肯定するためのデータとしてSimilarWebで調べた数値を根拠として計算されたと思われる「被害額」が公開され話題となったが、このSimilarWebで表示される「訪問数」などの数値はあてにならないという話がSEO技術に詳しい辻正浩氏のブログでまとめられている。

記事では日本ABC協会が公開している出版社系のWebサイトのユニークユーザーやPVなどのデータとSimilarWebのデータを比較しているのだが、その結果SimilarWebのデータはABC協会が公開していたデータ比べて大きくブレがあったという。

SimilarWebがどのようにしてトラフィックを推測しているのかは不明だが、その情報収集元の1つとしてWebブラウザの拡張機能による閲覧履歴を収集があると言われている。そのため実データと値が異なる可能性は高いと以前から指摘されており、今回の記事でも以下のように述べられている。

アクセス数が急上昇した非常に多くのPV数を持つ漫画サイト、かつ低年齢層や遵法意識が低い人が多く見るなど偏りがあるサイトがありましたら、そのデータの信頼性は低いのではないでしょうか?

ちなみにスラドの情報もSimilarWebで確認できるが、Google Analyticsで収集しているデータと比較してやはり数値に大きな違いがある。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 月間PV5000程度の我が弱小ブログが similarweb でどう出るか試してみたら
    オーバービューは表示データ無し、かろうじて PC/モバイルが50:50ってのと
    検索エンジン経由60件のうちのキーワード傾向が出るぐらいだった。

    ここから推測するに、おそらくテレビの視聴率と同様に
    数%程度の標本調査をして全体数を統計的に出しているのだろうね。
    そしてその標本数は、1%もしくはもっと少ないコンマ以下じゃないかと思われる。
    (うちのブログはほぼ100%検索エンジン経由なので60/5000なら1.2%)

    さらに、その元になる標本自体も、拡張機能を使って集めているとしたら
    かなり偏っていると推測されるってことかな?
    であれば実数と大きく合わないことも理解できる気がする。

  • by Anonymous Coward on 2018年11月06日 18時21分 (#3510951)

    Google Analyticsはadblockの使用やjavascriptの停止に対して無力だと思うので
    もしかしたらSimilarWebの方が正しい可能性もありますね
    ※正しいと主張してるわけではありません

    • by Anonymous Coward

      「かつ低年齢層や遵法意識が低い人が多く見るなど偏りがあるサイト」が偏りがあるなら、「ネット老人会のスクツ(何故か変換できるATOK)でITリテラシーばかりクソ高いサイト」も相当偏っているよな。

      少なくとも利用者層が似ているサイトで比較してみないといけないけど、漫画村の件なら、似たようなサイトを運営している人はある程度信頼でき、SimilarWebは信頼できないという指摘は誤りだ [kantei.go.jp]って言っているみたい。

    • by Anonymous Coward

      adblock や javascript を停止しているクライアントなんて
      球場の隣の高層ビルから試合を覗き見しているようなものでしょ。
      そんなの居ても居なくても同じことなんだから、
      そもそも「入場者数」のカウントに入れないのが正解だよ。

      • by Anonymous Coward

        入場者数のカウントに入れる必要があるかどうかはわかりませんが、
        デスクトップ版Firefoxユーザーの約2%は、プライベートウィンドウ時だけでなく常に既知のトラッカーをブロックしています。

        Always On Tracking Protection
        https://data.firefox.com/dashboard/usage-behavior [firefox.com]

    • by Anonymous Coward

      AlexaやJwordみたいに、トラッキング出来てるユーザーの集計でしかない。
      人数が多ければ平均に近づいていくんだろうけど、偏りが激しすぎて使い物にならん。
      自分の主張したいことがたまたま一致している時にだけ使えばいい。

  • by Anonymous Coward on 2018年11月06日 18時26分 (#3510954)

    論点としては「正確な被害把握ができていない状況で、犯罪を認定するべきか。どの値を仮定として採用するか」という話なので、SimilarWebの値がどう、というのは論点じゃないよ。
    被害を推定するときに、相対的にどの程度信頼できるかという話になる。ところがしないできないとそう言う指摘をしている方も、SimilarWeb以上に多少なりとも根拠がある数字を持ってこれてない。

    そこで、とりあえずその値を採用して話しているというのが現状。

    SimilarWebは色々と問題のある方法で調査してようやくこの程度の値を出している。コンプアイアンスがちゃんとしている所では、似たような事は他にできないので、確かに他にやりようがない。この記事でも「おそらくそうだ」という話はしているけれども、実際はどうなのか全く言及していない。それは分からないから仕方が無いことだけれど、少なくとも「Web屋の感覚的には~~~だ」というのよりは根拠があるし、「市場規模に対して被害額が大きすぎる」と言った理論的つながりがない詭弁よりはかなりマシと言う状況。

    少なくとも、多くの人は「どれだけ被害に遭ったかを被害者側が正確に算定し、誰の批判にも耐えるほどの確定情報がなければ、それは犯罪ではない」という世の中になって欲しくない、という事には同意してもらえると思うんだけど。

    という事で、論点はできるだけ正確に被害推定するということなので、SimilarWebそのものの精度はあんまり関係がない。もう、SimilarWebなんて正直どうでもいいので、実のある議論をして欲しいんだけどな。
    どうも件の会議でも、一部の委員がそうやって細かい枝葉をつつくことで議論の遅延を誘ったり、印象操作をしたりとそんな非建設的な戦略をとっていたようだけど、ほんと、マジ勘弁して欲しい。

    • かわんご乙

      親コメント
      • 印象操作で非建設的なのはやめろって言ってるコメントに、よくもまあこんなコメント書けるよな

        • by Anonymous Coward on 2018年11月06日 20時03分 (#3511041)

          いやだって、誰も犯罪ではないなんて言ってないし。
          審議会の資料みたって犯罪ではないだなんて誰も言ってないのに犯罪だと認めないなんてって言ってないよ?
          その被害額算定はおかしくないか?って言われてただけで。
          ブロッキングなんて多分に政治的意図が含まれているんだから盤外戦術取られるのも当たり前でその後のマスコミが善導するって発言とかよみました?
          賛成派陣営は盤外戦術を否定した発言してるけど実は賛成派も盤外戦しようとしてるんですよ。

          現行法上可能な手段は全て尽くしたのか?に対してCDNが開示しない!って主張に対して既にCDNは情報を開示しているし。
          出版社からの要請に開示しなかったのも出版社の権利は侵害されてないからじゃなかったっけ?
          出版社に委譲されているのは出版権に関わる権利のみで著作権自体は作者本人が持ってるんですよ。
          だから、出版社からのには開示しなかったも正しい。委任状でも取りゃよかったのにね。

          賛成派の言うCDNが開示しないの論陣が既に崩れてるし
          審議会で犯罪かどうかなんて議論にもなってないしその辺を勘違いしたのかわざとやってんのか
          色々表に出て来てない話も知っている立場としてはこれは賛成派のやっている盤外戦術の一種で
          なかった議論をあったかのようにして反対派はひどい奴だって思わせようとしている工作戦にしか見えてないよ
          なんも考えてないだけとは思ってるけど。

          お前今回のブロッキング議論が本当にただの海賊版サイトの話だけだと思ってんの?とだけ。
          https://srad.jp/comment/3511034 [srad.jp]
          の指摘含めてよーく考えろ
          審議会に参加していたメンバーのバックボーンまでよーく調べろ

          親コメント
          • by Anonymous Coward

            いやだって、誰も犯罪ではないなんて言ってないし。
            審議会の資料みたって犯罪ではないだなんて誰も言ってないのに犯罪だと認めないなんてって言ってないよ?
            その被害額算定はおかしくないか?って言われてただけで。

            これがこの話の本質だよ。

            見かけ上総論として、「どれだけ被害に遭ったかを被害者側が正確に算定し、誰の批判にも耐えるほどの確定情報がなければ、それは犯罪ではない」という事は誰も言わない。何故かと言えばそんなことを公言すれば人格を疑われるという事はよく知っているから。

            そうやって議論を避けつつも、しかしその直後に「被害額査

            • by Anonymous Coward on 2018年11月06日 22時04分 (#3511119)

              > 見かけ上総論として、「どれだけ被害に遭ったかを被害者側が正確に算定し、誰の批判にも耐えるほどの確定情報がなければ、それは犯罪ではない」という事は誰も言わない。何故かと言えばそんなことを公言すれば人格を疑われるという事はよく知っているから。
              いや、そんな話は誰もいってないし問題は問題だけれども現行法でできることを尽くしたのかどうか?が問題点としてあげられていたと記憶しているんだけど。
              だから、犯罪かどうかなんて誰も議論していなくってこの問題を防ぐに当たってっていう議論しかしておらず
              犯罪かどうか議論するのは刑法上の問題であり、審議会での目的ではないし何を混同させるように議論誘導しているの?盤外戦術そのものじゃねぇかよ。
              犯罪かどうか議論するのは司法権での話し合いであり、これは超法規的措置を執るに当たって現行法上では対応不可能であるのか?という立法権上の審議会だよね
              なんで司法権の話と混同させてるの?

              > そうやって議論を避けつつも、しかしその直後に「被害額査定がおかしい」というように、あっと言う間に覆される。
              算定額がおかしいっていうだけで他の方法はないのか?っていってそれぞれが動いてたよね。
              算定額に拘って3000億円も被害があるんだから!って主張したかわんごがいただけだろ。

              > 例えるなら「強姦は犯罪だが、同意していた可能性があるから合法だ」とか「差別は非常に良くないことだが、黒人は犯罪者が多い」といった様な主張。
              えーっと、前者はそりゃそうでしょ?合意をしていたのにもかかわらず女性が後から合意してなかった!っていったら強姦になる世界の方が恐ろしいよ?
              付き合っていて雰囲気でしちゃった後に分かれたら強姦されたって騒いだら強姦になる世界がいいの?
              婚前交渉がNGな立場であるのであればかまわんが、夫婦間でも強姦は認められることはあるので婚前交渉云々も何も関係なく
              合意があるとあったと見なせるのであれば強姦ではないのは当たり前だと思うんだけど。
              貴方のそれも貴方が言ってるように「犯罪じゃない」って言わせないための前提を共有しない典型的なレッテル貼りのための戦術だよね。自覚してる?
              黒人云々だって統計を取った上で、確かにそうならそう主張していいし逆に黒人側は白人警察官によるねつ造だっていう
              証拠を集めて主張すればいいわけでデータがあるのであれば差別でもなんでもないよ?
              この黒人云々もドイツなんかが陥ったポリコレが使う戦術だよね?差別を助長するからニュースにしてもだめだ!っていう。

              > そんなテクニックが使われているんだよ。そして、この件のように、SimilarWebの精度がどうの、といった枝葉に誘い込んで、議論を停滞させる。
              いや、だからかわんごがこんなに損害があるんだ!って主張したから反論されているだけで
              権利侵害が行われているからとだけいっておけばよかったんだと思うんだけど、被害額に拘ったのは誰だ?枝葉を作ったのはかわんごだぞ?

              > ・CDNが開示さえすれば問題がなくなるかのように言うのは印象操作。MioMioなどは依然として現行法では閉鎖もさせる事できず。賠償の可能性に至ってはほぼ現行法では無理
              印象操作も何も現行法できることを尽くしているのか?に対してCDNが開示しないんだって騒いだのはかわんごだぞ。なんで論点がずれてるんだよ?
              賛成派の最初の論陣はCDNが防弾になっていて開示をしてくれないのでそれ以上の訴訟ができない、だからブロッキングは必要っていう論陣だぞ
              CDNが開示した時点で前提が壊れているしブロッキングしたとしても権利が侵害されている事実は消えないので賠償云々は同じだよね?
              どうして、ブロッキングするだけで賠償が消えてなくなると思ったの?
              MIOMIO等はって今出版社の話をしていたんだが、映像に関してもあれは中国国内っぽいのでそっち側から働きかけていくしかないでしょう。
              もう一度いっておくが、ブロッキングしても権利を侵害しているという事実は消えないので賠償云々はかわらない。

              > ・米国でCDNの開示ができた、という事は日本国内法では対処ができなかった事を示すので、法治国家としては立法措置が必要であると言う論拠でしかない。
              米国法でもできたし、日本国内法でも漫画家が請求して開示できたけどニュース見てないの?日本国内でもCDN相手に訴訟を起こして普通に開示されているが。
              なんで開示できたのに立法が必要なの?

              > ・電子出版権があるので、作家本人ではない出版社からの開示請求でも応じなければならないのが現行法。(委任状云々は非弁行為になるためこの場合完全に無関係)
              ごめん、まじ委任状云々が非弁行為って意味がわからんない。
              出版社側の弁護士が漫画から委任状とればよかたっていってるんだけどなんで非弁行為なんだ?
              電子出版権があるからって電子出版権の侵害じゃ無理でしょ、だってそれ著作権法で保護されてる?
              侵害の事実があるからって話をしているのになんで電子出版権という契約上作り出された権利であって法律で保護されている権利ではないのでは?
              二者間契約の権利を侵害されたんだ!ってそりゃしらんがなって言われると思うんだが・・・

              貴方の前提条件がおかしい。

              親コメント
              • >そんな話は誰もいってないし問題は問題だけれども現行法でできることを尽くしたのかどうか?が問題点としてあげられていたと記憶しているんだけど。

                お願いだから、まず中間まとめ案と、https://ironna.jp/article/10996 [ironna.jp]あたりを読んでくれ。この辺りは問題点というわけじゃない。

                >罪かどうかなんて誰も議論していなくってこの問題を防ぐに当たってっていう議論しかしておらず

                そんなことはなく、実際に被害がどれだけあって、それが法律上どのような罪になるのか、という事もきちんと検討してまとめてから進んでるよ。そうでないと立法の措置としておかしいので。

              • by Anonymous Coward

                政治的スタンス上どちらにたっているのかわかっている上で結論のために書かれたサイトを見る意味が何の意味が。
                そのサイト読みましたけど、ブロッキングしたところで侵害は止まってません。見えないだけです。
                CODAの時点でずぶずぶの所じゃねぇか・・・それをソースだ!って言ってる時点で貴方のやっていることは
                貴方が批判している反対派のいう、盤外戦術をしているだけです。
                だから、何をどうすれば見れなくすれば権利侵害が回復しているの?してないよね?
                何の冗談でブロッキングすれば解決するんだって主張しているの?
                そもそもCODAが何の権利を持っていて何の被害者なんだ・

            • 正義を執行するためには正確な数字など不要!脅威を示せればそれでいい!

              って、それは正義面した詐欺師でしかないんだよなぁ

              親コメント
              • 正確な数字などは不要、って誰が言ったんですか?

                根拠がある数字に対して、それは間違いだと言うだけで正確な数字を示せなかった妨害派への批判という事で良いでしょうか。

              • 正確な数字を示せないなら、不正確な数字で行くしかないっていうのは、推進派だけが思っていることでしょう。
                大事な大事な人権保護の通信の秘密に例外を認めるのであれば、相当の正確な数字が必要だっていう反論は多くの人が支持できるものだと思う。

                だから、いくら被害を食い止めたいからと言って、間違いの不正確な数字を元に議論してはいけないと思う。
                他にないから仕方ないなんて事はなくて、アクセス数はわからないという前提を皆で共有してからその上で見積もりのブレの範囲も含めて協議していかないとダメでしょうね。

                親コメント
              • 妨害派と言い方をするから対する言葉として推進派という言葉を借りました。
                レッテル貼りだといいますが、被害対策の妨害が目的だというのと何が違うのでしょう。
                ブロッキングを強く主張しているのは事実でしょうし、
                緊急に走ったのも事実でしょう。実際にやるべきと言って、それを受けてやると行った通信事業者まで出た。
                そうした事実が不信を招き、安易なブロッキングに反対という立場が明確になっていったのです。

                そして、いつまでも「ブロッキング」を強く主張する態度が続くので、なんとしてもそれをやめさせなければならないという動きになったのしょう。

                推進派という言葉を使うなというのであれば、妨害派という言葉も辞めたほうがいいと思いますよ。
                犯罪対策に反対などしていないのです。
                ただし、犯罪対策よりも重大な人権侵害が目の前に迫っています。
                目の前の「ブロッキング推進の動き」を止める必要性のほうが、そんな犯罪対策なんかよりもずっと重要です。

                >>
                今のところ根拠のない、言わば間違いの不正確な数字すら出せてないのは妨害派の方です。

                余計なことをしようとする者を制止すると、すぐに対案を出せと言うに似ている気がします。
                不正確な数字を出して論ずるくらいなら、出さないほうがマシという事もあるでしょう。

                被害額が「大きい」と言っても、所詮一部の民間企業の営利活動です。人権には遠く及びません。

                親コメント
          • >審議会に参加していたメンバーのバックボーンまでよーく調べろ

            反対派の人々はLINEが作ったロビー団体、情報法制研究所の関係者だって話ですか?

    • by Anonymous Coward on 2018年11月06日 21時06分 (#3511079)

      論点としては「正確な被害把握ができていない状況で、犯罪を認定するべきか。どの値を仮定として採用するか」という話なので、SimilarWebの値がどう、というのは論点じゃないよ。

      いや、「犯罪の認定」の話ではないと思いますが。
      たとえ「犯罪の認定」の話だとしても、その場合は裁判を通じて立証・反証の機会が何度も与えられて、
      その批判に耐えた結果として損害の認定や賠償額が決まっていくので、
      信頼できない数字がそのまま認められるわけではありません。

      そのような司法のプロセスを通さずに、憲法に違反する可能性があっても、
      ヤバそうなサイトはブロッキングできる「仕組み」を作るのが今回の話で、
      その仕組み作りの必要性を示す根拠として、信用できるかわからない一企業が出している
      いい加減な数字を出せば、批判を受けるのは当然でしょう。

      必要なのは「犯罪の認定」の根拠ではなく、このような超法規的措置の法制化が必要となる根拠です。

      親コメント
      • by Anonymous Coward

        書き忘れたのでもう一つ

        今回は立法のプロセス、つまり現行の法律を変えようという手続きなのだから、今の法律を超えるのは正しいです。
        立法措置とは常に必ず「超法規的措置」となります。

        これもよく行われている印象操作で、刺激の強い言葉で誘導するテクニックだけど、ほんと、マジ勘弁して欲しい。

        • by Anonymous Coward

          現行の法律を変えようという手続きなのだから、個々の犯罪の認定よりも慎重な議論が必要になるのは当然ではないでしょうか?

          • by Anonymous Coward on 2018年11月06日 22時51分 (#3511145)

            その通りだよ。
            だから会議を開いて有識者が議論をまとめ、親会に報告して、最終的には選挙で選ばれた議員によって構成される内閣で閣議決定、それを元に法律を作り、民主主義に基づいて国会で議論し、立法というプロセスを取ろうとしてるんだよ。

            ところが、常に既存の法律にない者を書き加える立法措置を「超法規的」等と言う言葉で煽る人々がいて、さらに彼らの働きで、選挙で選ばれた議員の元にたどり着く前に「両論併記すら許さない」という形で報告書が出なかった、というのが今の状態。

            親コメント
            • by Anonymous Coward

              慎重な議論が必要なのは当然で、慎重な議論がなされているということですね。

    • 法律に詳しい方面の人ほど強い抵抗感を示すのはなぜか。

      法律をつくるというのは、何かを制限して何かを得ることだといえます。
      身体的自由に対する侵害を防ぐために精神的自由を制限するのなら得失の釣り合いが取れるのですが、金銭的損害を防ぐために精神的自由を制限するのは割に合わないよね、というのが根幹にあるからだと思います。
      (基本的人権は日本国民の生命そのものであり、カネは所詮カネである、という前提でね)
      でも、もし被害額が莫大で業界が崩壊して多くの人が路頭に迷い電車に飛び込む者まで出るレベルの危機にあるとしたら、それは精神的自由の制限に手を付けてでもブロッキング法制化を進める価値が出てきます。
      だから被害額を正確に算定することはとても重要で、その内容次第で基本的人権の一部を切り崩すかどうかを判断したいところなのです。そこで不正確な(盛ったと疑われかねない)被害額が出てくるのは相当に許しがたいことでしょう。

      一方、推進派の考え方は個人的に理解しきれていないのですが、ネットワーク技術で損害が生じるのなら、それをネットワーク技術で防くのが最善手だとシンプルに考えているのかなと思います。
      (現実問題としてお金こそ人を幸せにできる存在であり、その流失を防ぐのは重要な課題ともいえます)
      法制化というのはブロッキング技術を普及させるための後ろ盾程度に捉えていて、民間企業にサービスを売り込むノリで盛り盛りの数字でプレゼン資料作っちゃった的なところが見え隠れするのがなんとも残念に思いました。

      親コメント
    • by Anonymous Coward

      それは同意かな。
      元記事が大幅に内容変更をしているけど、それを踏まえた上で
      SimilarWebは本当のPVと比べて大きい値を提示する傾向がある。だから実際の被害額は1/nだ という主張は同意出来る。

      あと漫画市場が4300億程度なのに3000億の被害額があるわけがない!って主張あったけど、それは違うよね。
      違法な手段で何円のコンテンツが何回ダウンロードされたのであれば、被害額はそれの掛け算になるし
      別に違法DLが無かったらその分が全部正規購入されたはずだ!なんて主張はしてないわけで。

      • by Anonymous Coward

        >SimilarWebは本当のPVと比べて大きい値を提示する傾向がある。だから実際の被害額は1/nだ という主張は同意出来る。

        仮にこれが事実だとしても、ブレは最大で3倍程度だから、最小でも1000億円規模の被害が出ているんだぜ。三千億円の被害が想定されているものが、仮に一千億の被害になったからと言って、被害防止が不要とか言う話にはならないでしょうよ

        だから結局、SimilarWebの精度がどうのなんて議論は全く論点が違うんだよ。

    • by Anonymous Coward

      少なくとも、多くの人は「どれだけ被害に遭ったかを被害者側が正確に算定し、誰の批判にも耐えるほどの確定情報がなければ、それは犯罪ではない」という世の中になって欲しくない、という事には同意してもらえると思うんだけど。

      それって「疑わしきは罰する」ということじゃないかな? 誰の批判にも耐えるほどの確定的な証拠がなければ冤罪が起きる。

  • マーケティング用途ならこっちの方が優秀じゃね

    • by Anonymous Coward

      いくら広告ブロック使ってようが、誰もがネットの意見も参考にしながら物を買うんだから、あんまり意味ないかもしれない。

    • by Anonymous Coward

      人気のある真っ当な拡張を購入してトラッカーを付け加えているんだよ
      Stylishとかね

  • by Anonymous Coward on 2018年11月06日 19時29分 (#3511016)

    >その結果SimilarWebのデータはABC協会が公開していたデータ比べて大きくブレ

    そもそもABC協会の新聞、雑誌の発行部数発表も盛大に盛られてるけどな…

    • by Anonymous Coward

      印刷証明付き部数はあくまでも刷られた数であって、その後シュレッダー直行とか押し紙として販売店に押し付けられたあと廃棄されるとかしても嘘ではないからね。

    • by Anonymous Coward

      人んちのサイトのPV数が正確に測れたら、それはそれで怖い。
      桁があってりゃいいんじゃないのこんなの。

  • 批判厳禁。ってことか

    • by Anonymous Coward

      なんでそういう結論になるのかわからないけど

    • by Anonymous Coward

      むしろ盛大にやってBANされるかどうか試してみてくれ。その時は別IPでタレコミ、よろしく。

    • by Anonymous Coward

      OSDNに雇われてるんだから、見ようと思えば見ることは出来るでしょ。
      だからと言って、何も不正なことやってるわけでもないし(過去にあったホットラインセンターからの削除依頼と裁判所からのログ開示はサイト運営してれば普通のことだし)。

typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...