パスワードを忘れた? アカウント作成
13627189 story
インターネット

慶應義塾大学、電子ジャーナルや電子ブック利用時のWebブラウザの先読み機能の無効化を要請 51

ストーリー by hylom
プラットフォーム側でなんとかして欲しいのだが 部門より

慶應大学が、大学が契約する電子ジャーナル・電子ブックにアクセスする際はWebブラウザのリンク先読み機能を利用しないよう告知している(告知ページ)。

Webブラウザのリンク先読み機能によって、利用者の意図無しに電子ジャーナルや電子ブックが短期間で大量にダウンロードされる状況が発生しているとのこと。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • hylomのブログ (スコア:3, 参考になる)

    by Anonymous Coward on 2018年06月21日 7時32分 (#3429347)

    http://hylom.net/2010/06/03/html5_link_prefetch/ [hylom.net]

    に書いてあるように、"x-moz: prefetch"をわざわざ付けてるんだから、Firefoxはサーバー側で弾けばいいだけ。Safariなら"X-Purpose: preview"。Apacheでもnginxでもすぐに設定できる。 Chromeはどうしようもないらしいが。Webkitが枝分かれした時はあったんだから、なんか意図的な理由なんだろうけど。

    • by Anonymous Coward on 2018年06月21日 9時30分 (#3429422)

      最大シェアを誇ってるChromeがどうしようもないって時点で、サーバ側で弾けばいいだけなんてとても言えないと思うのだけど

      親コメント
      • by Anonymous Coward

        校内利用なんだから環境の制限とかは別にやっても良いと思うけどな。

        • by Anonymous Coward

          UA文字列で弾けばいいだけだしね。

          # そして戦争へ

    • by Anonymous Coward

      学内から、学外のサイトにアクセスする場合の話でしょ。大学が管理してるサーバの話ではない。

      大学図書館が、論文業者(とを仲介する中間業者)との間で、
      文献1個のダウンロード辺りいくらとか、月に文献何個までダウンロード可能とか、そういうライセンスで契約してる。

      なので、wgetでうぇーい、とかやると、即、警告が飛んでくるし、絶対やるなよ、絶対だぞ、と念押しされてる。

      その流れで、読む気も無い物の自動ダウンロードは止めろ、という話。

  • by Anonymous Coward on 2018年06月21日 7時33分 (#3429350)

    楽天市場のWebを開くと表示されるべきキャンペーン一覧などが表示されない事がよくあったけど、この設定をやってみたらちゃんと表示されるようになり、ページ表示完了までの時間も短くなった。

    1ページ内に大量にリンクが設置されているような作りのWebページを閲覧する場合、リンク先読みのために無駄な通信が大量に発生して逆にパフォーマンスを落としてしまっている感じ。

    • >1ページ内に大量にリンクが設置されているような作りのWebページを

      それって、ページそのものには情報が乏しい単なるリンク集みたいなもんなんすかね。

      親コメント
      • 単に作りの問題では
        Wikiみたいに勝手にリンクができるシステムで既知単語が多けりゃ大量にリンクできるでしょうし

        しかし元コメみたいな自体になるようじゃ先読みが過剰なんですかねぇ

        親コメント
        • by Anonymous Coward on 2018年06月21日 15時32分 (#3429746)

          >しかし元コメみたいな自体になるようじゃ先読みが過剰なんですかねぇ
          というよりも先読みはユーザーへの利便提供なんだから、それが過剰な負荷となると手控える様な構造になってないといけないと思うんだ。

          なんで閲覧よりも先読みの方が優先される様な構造になっちゃってんだろうか?
          ユーザーの閲覧や操作の方が先読みより十分にプライオリティが高い実装なら問題にはならない筈だろうに。

          親コメント
          • by Anonymous Coward

            広告が遅延ロードになってる都合上、広告より先読みが優先されてセッションが溢れてしまうとか?
            そして、先読みが終わり、広告がレンダリング終わるまで結果的に操作不能。

            • by Anonymous Coward

              >広告が遅延ロードになってる都合上、広告より先読みが優先されてセッションが溢れてしまうとか?
              それを検出した時点で先読み止めれば良さそうに思うが。

        • by Anonymous Coward

          楽天系のInfoseekも重いですね。
          楽天は同業他社に比べるとWebサイトがとにかく重い。

      • by Anonymous Coward

        ページに情報が有るか無いかは関係ない。
        楽天なんかでは客が見ているモノに対して沢山の他の物やサービスのお薦めが有るってだけ。

        今見ているページだってリンクの数はそこそこ有るのだけど。

    • by Anonymous Coward

      まとめ系サイトとかにも有効ですね。

  • by Anonymous Coward on 2018年06月21日 9時16分 (#3429413)

    firefoxの場合です
    公式のFAQですがabout:configいじるしかないようですね
    https://support.mozilla.org/ja/kb/how-stop-firefox-automatically-makin... [mozilla.org]

    • by Anonymous Coward on 2018年06月21日 14時25分 (#3429689)
      昔はアドオンとかでカスタマイズ性の高さを売りにしてたのに
      今やFirefoxって一番カスタマイズ効かないブラウザだよね…
      親コメント
      • by Anonymous Coward

        サイト別設定を個別にカスタマイズする手段が消えてたり、何かしようとするとabout:configとかSQLiteでDB直接開くしかないという。
        その部分を補完していた機能拡張は既に亡い。

    • by Anonymous Coward

      これ [mozilla.org]見ると普通のAタグだけでは先読みしないようだけどどうなんだろう。
      電子ジャーナル側がわざわざ先読み指定してるのかな

      • by Anonymous Coward

        わざわざ先読み指定しているものを手作業で止めるよう設定させるとか手作りの温かみすぎる

  • by Anonymous Coward on 2018年06月21日 7時11分 (#3429339)

    大量ダウンロードする人は別の方法で対応するべきで、利用者全員に対応を求めるの?
    契約がどうなってるか知らんが今の時代、サーバー代がバカにならないほど高いわけじゃないでしょ。

    • by Anonymous Coward on 2018年06月21日 7時16分 (#3429341)

      短時間大量アクセスは契約違反だそうだ

      親コメント
    • by Anonymous Coward

      よく読みましょう。大量にダウンロードしようと意図しなくても、大量にダウンロードされてしまうという問題ですよ。

      • by Anonymous Coward on 2018年06月21日 9時15分 (#3429411)

        リンクによりユーザーの意図しない挙動を起こさせるサイトは違法じゃね。

        親コメント
        • 危ないサイトはいくらでもあるんだから防衛は当然。

          --
          the.ACount
          親コメント
        • by Anonymous Coward

          なんでブラウザの先読み機能のために起こっていることがサイト側の責任になるのだろう

          • by Anonymous Coward

            相手は法治国家の警察だからな

            あれっ?

          • by Anonymous Coward

            全然違う話になるけど、リンク先が児童ポルノでログ精査が足らずにダウンロードしたことになって逮捕とかはありそうだな。

        • by Anonymous Coward

          もうリンククリックするたびに「あなたは本当にこのファイルをダウンロードしたいですか?YES/NO」と確認させたり、「あなたが人間であることを証明するために、下の画像から自動車を選んでください」とかせにゃならんのかなあ。

    • by Anonymous Coward

      不特定多数の一般人に求めてるわけじゃなくて、学内から利用する学生に求めてるわけですが。

    • by Anonymous Coward

      大学が契約する電子ジャーナル・電子ブックなら、従量課金の問題なんじゃないの?
      大学内の特定のIPアドレスから電子ジャーナルに自由にアクセスできる設定になっていて、支払いは従量課金とか、当年度の実績で次年度の契約金額を見直すとかはよくある。

  • by Anonymous Coward on 2018年06月21日 7時37分 (#3429352)

    は取られて居るんだろうか?

    最近のブラウザまわりの状況に詳しくないけど、先読み時には何か追加のヘッダが付くとか、
    html内の要素で先読みの可否を判断しているとか、そういうのはないんだろうか??

    • by Anonymous Coward

      httpなら何とかなるかも知れないけど、httpsになるとプロキシサーバはhttpヘッダの内容を見たり書き換えたりできないので対処不能。

      とかあって、httpsが主になりつつある昨今、学外アクセスはプロキシを介した接続以外不許可、として
      プロキシで何らかのセキュリティ対策を取ろうとか、ログをちゃんと取ろうとかが無駄になってきてる。

      そんなこんなで、別の大学だけど、最近ようやくプロキシを介さない学外アクセスが解禁された。

  • by Anonymous Coward on 2018年06月21日 9時09分 (#3429402)

    wget禁止と同じ理屈ですね
    昔は巡回するのがめんどくさくてまとめてダウンロードしたら
    部外秘書類がまじってて焦ったことあったなあ

    もしかして本当の理由はセキュリティ?

    • by Anonymous Coward

      うん、wgetで他部の秘書みたいなたぐいの人をダウンロード出来ちゃったら、それは確かに焦るな。

  • by Anonymous Coward on 2018年06月21日 9時45分 (#3429440)

    ブラウザ 先読み機能 [google.com]でググると(このトピがらみの1件を除いても)50件中18件くらいが各大学・図書館の同様の要請なんだな。
    で、この利用者に意図しないリソースの消費はブラウザ側の挙動なのでブラウザ開発者(開発企業)がしょっ引かれるの?

  • 総てのリンクを軽量なスタブ経由
    パラメータをクライアントサイドスクリプトで処理して次へ進む簡便化施してさ

  • by Anonymous Coward on 2018年06月21日 10時06分 (#3429463)

    href="javascript:window.open('http://......')"みたいに置換するだけで先読みされなくなるんじゃないの

    • by Anonymous Coward

      先読み指定がついてないと先読みしないブラウザも先読み機能を切れってなってるし、
      そもそもが先読み指定されたページ・リンクが生成されていると思われる。

      問題のあるページ・リンクの生成が大学側であればまず先読み指定を外すだけでいい。

      問題のあるページ・リンクの生成が電子ジャーナル側であるなら、
      向こうが自分で勝手に先読みさせて先読みするなとキレてる形になる。
      向こうが勝手につけてるものだからブラウザ側で先読み機能を切るしかない。

      従量制とか段階的定額制とかでセコく稼ぐ気ならやりかねんし、ぶっちゃけ後者臭い。
      となるとまんまと罠にハマって大学側の契約するリミットに即到達して大学側が泣いてる形か、
      大学というデカブツ相手にセコい商売仕掛けたは良いけどデカすぎて自滅して大学側に泣きついたか。

      まぁどのパターンとしても救いがねぇなぁ・・・・・・バカばっかと言うかなんというか。

  • by Anonymous Coward on 2018年06月21日 11時22分 (#3429525)

    https://developer.mozilla.org/ja/docs/Web/HTTP/Link_prefetching_FAQ [mozilla.org]
    によると、ダグでPrefetchするように指定してるように見えるけど。
    ジャーナルサイトが有料の論文や電子ブックを勝手にPrefetchするようにダグで仕込んでるんだとしたら、これこそ不正電磁ナントカ案件じゃないの?

    • by Anonymous Coward

      「ダグ」ってなんだ……
      「タグ」って打っても予測変換で「ダグ」が先に出るのか……orz

      • by Anonymous Coward

        Android版mozc系は濁点省略が可能なので、起こりえる。

  • by Anonymous Coward on 2018年06月21日 13時22分 (#3429605)

    研究者の業績を論文数やインパクトファクターとかで測るへんてこなシステムが定着

    年間の出版論文数が激増

    出版論文数の増加を口実に出版社は論文雑誌購読料を値上げ

    運営費交付金一律カットなどで財政的に厳しい大学は、少しでも出費を圧縮するために冊子体購入を断念して電子出版購読に流れる

    利用者側は電子出版購読で利便性がよくなったと喜ぶが、そのうち雑誌まるまる一冊をダウンロード(しかもスクリプトなどで機械的に)する輩があらわれる

    出版社側は「雑誌まるまる一冊ダウンロードなんて契約違反です」といって、その大学のネットワークを一括でブロックする

    そういうことが起こるたび、大学図書館職員や学内の図書委員の担当者が、学内の当事者に事情聴取し、出版社側には意図しない大量ダウンロードであったことを説明してブロック解除をお願いする

    …ということが、あまりにも頻繁に起こるので、利用者側の設定で回避できるなら回避してよ~、と泣きがはいる ←いまここ

    • 本題とは関係なくて申し訳ないですが
      > 研究者の業績を論文数やインパクトファクターとかで測るへんてこなシステムが定着
      より良いシステムってどんなの何ですかね
      本当に難しいよねこういうの

      親コメント
    • 学内の話なんだから、学内用にプロキシなりブロックなりすればいいんじゃないの?
      末端利用者にいちいち要望してもしょうがないというか、どうせあてにはならないだろ。

      親コメント
      • by Anonymous Coward

        プロキシでキャッシュするのも契約違反なんじゃね?

    • 大学の図書委員をやっていますがだいぶ違う環境にいらっしゃるようです。

      1番目は難儀な業界にいらっしゃるのですねという感想です。経済学はtop5, フィールドトップ、その他で十分業績に差が付くのでIFや論文数はあまり考慮されません。学会で最も評価のEconometricaは理解できる読者が少ないのでISIEconomicsランクが22位です。(統計学では5位なのですけど)
      https://onlinelibrary.wiley.com/journal/14680262 [wiley.com]
      2番目の論文出版数を急増については、一部のオープンアクセス誌(PlosOne、ScientificReports)くらいで、学会で高い評価を得ている雑誌で近年出版数を増やしているものは稀です。
      3番目の値上げについてはElsevierに代表される大手出版社が合併による市場支配力上昇と抱き合わせによる余剰吸い上げで値上げをしており、出版数とは無関係です。
      4番目は財政カットがなくても紙媒体より電子媒体を好むので財政に問題が無くても紙媒体への需要は減っています。
      5番目はそういうこともあるかもしれません
      6番目は雑誌一冊まるごとDL位は日常茶飯事なので程度についての記述が不適切です
      7番目はそういう大学もあるのかもしれませんが、具体例を聞いたことが有りません

      どのような分野では元コメのようなことになっているのか関心があります。

      ひょっとするとPPVを導入した大学で先読み設定で無駄にPPVを消費してるケースがあるのかもしれないと思いました。

      親コメント
      • by Anonymous Coward

        ネットワーク管理者の立場から,後半部分について,
        「機械的なダウンロード」が禁止されているが,その基準は明示されていないというケースが多いようです。
        基準を明示するとそれを超えない範囲で実行される可能性があるから,とか。

        違反すると特定のIPアドレスからのアクセスがブロックされることもあります。
        ネットワーク構成によっては広範囲に影響することも。
        最近は一定期間で自動的にブロック解除されるようになってきているようですが,調査・報告はおこなっています。

        電子媒体の移行については,置き場所の問題が大きいかと思います。財政カットの影響とすると
        お金がない → 書架増やせない → 電子媒体化 という流れはあったかも。
        因果関係は難しいですが,いずれにしても,大学図書館は電子ジャーナル以外にお金が回せないのが現状ではない
        でしょうか。

        # 紙媒体の需要減というか「図書館まで行ってゼロックスでコピー取るより,研究室のプリンタで印刷する方が楽」
        # ってことなんですよね,ペーパーレス化への道は遠い。

    • by Anonymous Coward

      え。つい最近論文数が減ったってトピあったよな…。

    • by Anonymous Coward

      >利用者側は電子出版購読で利便性がよくなったと喜ぶが、そのうち雑誌まるまる一冊をダウンロード(しかもスクリプトなどで機械的に)する輩があらわれる

      それこそサイト側がCAPTCHAなり導入すればいいと思うんだが。
      契約違反だろうがどっちが悪かろうが、自動化対策、クローラ負荷対策にCAPTCHA入れるって大手サイトならどこでもやってる常識レベルの対応じゃね?
      人間が数本ずつ論文読む程度ならCAPTCHAも苦ではないだろ。

  • by Anonymous Coward on 2018年06月21日 22時04分 (#3430025)

    ってなんですか?

typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...