
慶應義塾大学、電子ジャーナルや電子ブック利用時のWebブラウザの先読み機能の無効化を要請 51
ストーリー by hylom
プラットフォーム側でなんとかして欲しいのだが 部門より
プラットフォーム側でなんとかして欲しいのだが 部門より
慶應大学が、大学が契約する電子ジャーナル・電子ブックにアクセスする際はWebブラウザのリンク先読み機能を利用しないよう告知している(告知ページ)。
Webブラウザのリンク先読み機能によって、利用者の意図無しに電子ジャーナルや電子ブックが短期間で大量にダウンロードされる状況が発生しているとのこと。
hylomのブログ (スコア:3, 参考になる)
http://hylom.net/2010/06/03/html5_link_prefetch/ [hylom.net]
に書いてあるように、"x-moz: prefetch"をわざわざ付けてるんだから、Firefoxはサーバー側で弾けばいいだけ。Safariなら"X-Purpose: preview"。Apacheでもnginxでもすぐに設定できる。 Chromeはどうしようもないらしいが。Webkitが枝分かれした時はあったんだから、なんか意図的な理由なんだろうけど。
Re:hylomのブログ (スコア:1)
最大シェアを誇ってるChromeがどうしようもないって時点で、サーバ側で弾けばいいだけなんてとても言えないと思うのだけど
Re: (スコア:0)
校内利用なんだから環境の制限とかは別にやっても良いと思うけどな。
Re: (スコア:0)
UA文字列で弾けばいいだけだしね。
# そして戦争へ
Re: (スコア:0)
学内から、学外のサイトにアクセスする場合の話でしょ。大学が管理してるサーバの話ではない。
大学図書館が、論文業者(とを仲介する中間業者)との間で、
文献1個のダウンロード辺りいくらとか、月に文献何個までダウンロード可能とか、そういうライセンスで契約してる。
なので、wgetでうぇーい、とかやると、即、警告が飛んでくるし、絶対やるなよ、絶対だぞ、と念押しされてる。
その流れで、読む気も無い物の自動ダウンロードは止めろ、という話。
楽天市場のページ表示が改善された (スコア:1)
楽天市場のWebを開くと表示されるべきキャンペーン一覧などが表示されない事がよくあったけど、この設定をやってみたらちゃんと表示されるようになり、ページ表示完了までの時間も短くなった。
1ページ内に大量にリンクが設置されているような作りのWebページを閲覧する場合、リンク先読みのために無駄な通信が大量に発生して逆にパフォーマンスを落としてしまっている感じ。
Re:楽天市場のページ表示が改善された (スコア:1)
>1ページ内に大量にリンクが設置されているような作りのWebページを
それって、ページそのものには情報が乏しい単なるリンク集みたいなもんなんすかね。
Re:楽天市場のページ表示が改善された (スコア:2)
単に作りの問題では
Wikiみたいに勝手にリンクができるシステムで既知単語が多けりゃ大量にリンクできるでしょうし
しかし元コメみたいな自体になるようじゃ先読みが過剰なんですかねぇ
Re:楽天市場のページ表示が改善された (スコア:1)
>しかし元コメみたいな自体になるようじゃ先読みが過剰なんですかねぇ
というよりも先読みはユーザーへの利便提供なんだから、それが過剰な負荷となると手控える様な構造になってないといけないと思うんだ。
なんで閲覧よりも先読みの方が優先される様な構造になっちゃってんだろうか?
ユーザーの閲覧や操作の方が先読みより十分にプライオリティが高い実装なら問題にはならない筈だろうに。
Re: (スコア:0)
広告が遅延ロードになってる都合上、広告より先読みが優先されてセッションが溢れてしまうとか?
そして、先読みが終わり、広告がレンダリング終わるまで結果的に操作不能。
Re: (スコア:0)
>広告が遅延ロードになってる都合上、広告より先読みが優先されてセッションが溢れてしまうとか?
それを検出した時点で先読み止めれば良さそうに思うが。
Re: (スコア:0)
楽天系のInfoseekも重いですね。
楽天は同業他社に比べるとWebサイトがとにかく重い。
Re: (スコア:0)
ページに情報が有るか無いかは関係ない。
楽天なんかでは客が見ているモノに対して沢山の他の物やサービスのお薦めが有るってだけ。
今見ているページだってリンクの数はそこそこ有るのだけど。
Re: (スコア:0)
まとめ系サイトとかにも有効ですね。
停止方法 (スコア:1)
firefoxの場合です
公式のFAQですがabout:configいじるしかないようですね
https://support.mozilla.org/ja/kb/how-stop-firefox-automatically-makin... [mozilla.org]
Re:停止方法 (スコア:1)
今やFirefoxって一番カスタマイズ効かないブラウザだよね…
Re: (スコア:0)
サイト別設定を個別にカスタマイズする手段が消えてたり、何かしようとするとabout:configとかSQLiteでDB直接開くしかないという。
その部分を補完していた機能拡張は既に亡い。
Re: (スコア:0)
これ [mozilla.org]見ると普通のAタグだけでは先読みしないようだけどどうなんだろう。
電子ジャーナル側がわざわざ先読み指定してるのかな
Re: (スコア:0)
わざわざ先読み指定しているものを手作業で止めるよう設定させるとか手作りの温かみすぎる
それって利用者が求めていることなのかな? (スコア:0)
大量ダウンロードする人は別の方法で対応するべきで、利用者全員に対応を求めるの?
契約がどうなってるか知らんが今の時代、サーバー代がバカにならないほど高いわけじゃないでしょ。
Re:それって利用者が求めていることなのかな? (スコア:1)
短時間大量アクセスは契約違反だそうだ
Re: (スコア:0)
よく読みましょう。大量にダウンロードしようと意図しなくても、大量にダウンロードされてしまうという問題ですよ。
Re:それって利用者が求めていることなのかな? (スコア:3, おもしろおかしい)
リンクによりユーザーの意図しない挙動を起こさせるサイトは違法じゃね。
Re:それって利用者が求めていることなのかな? (スコア:1)
危ないサイトはいくらでもあるんだから防衛は当然。
the.ACount
Re: (スコア:0)
なんでブラウザの先読み機能のために起こっていることがサイト側の責任になるのだろう
Re: (スコア:0)
相手は法治国家の警察だからな
あれっ?
Re: (スコア:0)
全然違う話になるけど、リンク先が児童ポルノでログ精査が足らずにダウンロードしたことになって逮捕とかはありそうだな。
Re: (スコア:0)
もうリンククリックするたびに「あなたは本当にこのファイルをダウンロードしたいですか?YES/NO」と確認させたり、「あなたが人間であることを証明するために、下の画像から自動車を選んでください」とかせにゃならんのかなあ。
Re: (スコア:0)
不特定多数の一般人に求めてるわけじゃなくて、学内から利用する学生に求めてるわけですが。
Re: (スコア:0)
大学が契約する電子ジャーナル・電子ブックなら、従量課金の問題なんじゃないの?
大学内の特定のIPアドレスから電子ジャーナルに自由にアクセスできる設定になっていて、支払いは従量課金とか、当年度の実績で次年度の契約金額を見直すとかはよくある。
サーバ or プロキシ側での対策 (スコア:0)
は取られて居るんだろうか?
最近のブラウザまわりの状況に詳しくないけど、先読み時には何か追加のヘッダが付くとか、
html内の要素で先読みの可否を判断しているとか、そういうのはないんだろうか??
Re: (スコア:0)
httpなら何とかなるかも知れないけど、httpsになるとプロキシサーバはhttpヘッダの内容を見たり書き換えたりできないので対処不能。
とかあって、httpsが主になりつつある昨今、学外アクセスはプロキシを介した接続以外不許可、として
プロキシで何らかのセキュリティ対策を取ろうとか、ログをちゃんと取ろうとかが無駄になってきてる。
そんなこんなで、別の大学だけど、最近ようやくプロキシを介さない学外アクセスが解禁された。
wget (スコア:0)
wget禁止と同じ理屈ですね
昔は巡回するのがめんどくさくてまとめてダウンロードしたら
部外秘書類がまじってて焦ったことあったなあ
もしかして本当の理由はセキュリティ?
Re: (スコア:0)
うん、wgetで他部の秘書みたいなたぐいの人をダウンロード出来ちゃったら、それは確かに焦るな。
ブラウ+先読み機能 (スコア:0)
ブラウザ 先読み機能 [google.com]でググると(このトピがらみの1件を除いても)50件中18件くらいが各大学・図書館の同様の要請なんだな。
で、この利用者に意図しないリソースの消費はブラウザ側の挙動なのでブラウザ開発者(開発企業)がしょっ引かれるの?
クリック必要な転送ページを挟む広告みたいにすりゃいいじゃん。 (スコア:0)
総てのリンクを軽量なスタブ経由
パラメータをクライアントサイドスクリプトで処理して次へ進む簡便化施してさ
リンクをJavaScriptに変えればいいのでは (スコア:0)
href="javascript:window.open('http://......')"みたいに置換するだけで先読みされなくなるんじゃないの
Re: (スコア:0)
先読み指定がついてないと先読みしないブラウザも先読み機能を切れってなってるし、
そもそもが先読み指定されたページ・リンクが生成されていると思われる。
問題のあるページ・リンクの生成が大学側であればまず先読み指定を外すだけでいい。
問題のあるページ・リンクの生成が電子ジャーナル側であるなら、
向こうが自分で勝手に先読みさせて先読みするなとキレてる形になる。
向こうが勝手につけてるものだからブラウザ側で先読み機能を切るしかない。
従量制とか段階的定額制とかでセコく稼ぐ気ならやりかねんし、ぶっちゃけ後者臭い。
となるとまんまと罠にハマって大学側の契約するリミットに即到達して大学側が泣いてる形か、
大学というデカブツ相手にセコい商売仕掛けたは良いけどデカすぎて自滅して大学側に泣きついたか。
まぁどのパターンとしても救いがねぇなぁ・・・・・・バカばっかと言うかなんというか。
Link Prefetchingダグ (スコア:0)
https://developer.mozilla.org/ja/docs/Web/HTTP/Link_prefetching_FAQ [mozilla.org]
によると、ダグでPrefetchするように指定してるように見えるけど。
ジャーナルサイトが有料の論文や電子ブックを勝手にPrefetchするようにダグで仕込んでるんだとしたら、これこそ不正電磁ナントカ案件じゃないの?
Re: (スコア:0)
「ダグ」ってなんだ……
「タグ」って打っても予測変換で「ダグ」が先に出るのか……orz
Re: (スコア:0)
Android版mozc系は濁点省略が可能なので、起こりえる。
背景とかそういうのをご存じない方に説明すると (スコア:0)
研究者の業績を論文数やインパクトファクターとかで測るへんてこなシステムが定着
↓
年間の出版論文数が激増
↓
出版論文数の増加を口実に出版社は論文雑誌購読料を値上げ
↓
運営費交付金一律カットなどで財政的に厳しい大学は、少しでも出費を圧縮するために冊子体購入を断念して電子出版購読に流れる
↓
利用者側は電子出版購読で利便性がよくなったと喜ぶが、そのうち雑誌まるまる一冊をダウンロード(しかもスクリプトなどで機械的に)する輩があらわれる
↓
出版社側は「雑誌まるまる一冊ダウンロードなんて契約違反です」といって、その大学のネットワークを一括でブロックする
↓
そういうことが起こるたび、大学図書館職員や学内の図書委員の担当者が、学内の当事者に事情聴取し、出版社側には意図しない大量ダウンロードであったことを説明してブロック解除をお願いする
↓
…ということが、あまりにも頻繁に起こるので、利用者側の設定で回避できるなら回避してよ~、と泣きがはいる ←いまここ
Re:背景とかそういうのをご存じない方に説明すると (スコア:2)
本題とは関係なくて申し訳ないですが
> 研究者の業績を論文数やインパクトファクターとかで測るへんてこなシステムが定着
より良いシステムってどんなの何ですかね
本当に難しいよねこういうの
Re:背景とかそういうのをご存じない方に説明すると (スコア:2)
学内の話なんだから、学内用にプロキシなりブロックなりすればいいんじゃないの?
末端利用者にいちいち要望してもしょうがないというか、どうせあてにはならないだろ。
Re: (スコア:0)
プロキシでキャッシュするのも契約違反なんじゃね?
Re:背景とかそういうのをご存じない方に説明すると (スコア:1)
大学の図書委員をやっていますがだいぶ違う環境にいらっしゃるようです。
1番目は難儀な業界にいらっしゃるのですねという感想です。経済学はtop5, フィールドトップ、その他で十分業績に差が付くのでIFや論文数はあまり考慮されません。学会で最も評価のEconometricaは理解できる読者が少ないのでISIEconomicsランクが22位です。(統計学では5位なのですけど)
https://onlinelibrary.wiley.com/journal/14680262 [wiley.com]
2番目の論文出版数を急増については、一部のオープンアクセス誌(PlosOne、ScientificReports)くらいで、学会で高い評価を得ている雑誌で近年出版数を増やしているものは稀です。
3番目の値上げについてはElsevierに代表される大手出版社が合併による市場支配力上昇と抱き合わせによる余剰吸い上げで値上げをしており、出版数とは無関係です。
4番目は財政カットがなくても紙媒体より電子媒体を好むので財政に問題が無くても紙媒体への需要は減っています。
5番目はそういうこともあるかもしれません
6番目は雑誌一冊まるごとDL位は日常茶飯事なので程度についての記述が不適切です
7番目はそういう大学もあるのかもしれませんが、具体例を聞いたことが有りません
どのような分野では元コメのようなことになっているのか関心があります。
ひょっとするとPPVを導入した大学で先読み設定で無駄にPPVを消費してるケースがあるのかもしれないと思いました。
Re: (スコア:0)
ネットワーク管理者の立場から,後半部分について,
「機械的なダウンロード」が禁止されているが,その基準は明示されていないというケースが多いようです。
基準を明示するとそれを超えない範囲で実行される可能性があるから,とか。
違反すると特定のIPアドレスからのアクセスがブロックされることもあります。
ネットワーク構成によっては広範囲に影響することも。
最近は一定期間で自動的にブロック解除されるようになってきているようですが,調査・報告はおこなっています。
電子媒体の移行については,置き場所の問題が大きいかと思います。財政カットの影響とすると
お金がない → 書架増やせない → 電子媒体化 という流れはあったかも。
因果関係は難しいですが,いずれにしても,大学図書館は電子ジャーナル以外にお金が回せないのが現状ではない
でしょうか。
# 紙媒体の需要減というか「図書館まで行ってゼロックスでコピー取るより,研究室のプリンタで印刷する方が楽」
# ってことなんですよね,ペーパーレス化への道は遠い。
Re: (スコア:0)
え。つい最近論文数が減ったってトピあったよな…。
Re: (スコア:0)
>利用者側は電子出版購読で利便性がよくなったと喜ぶが、そのうち雑誌まるまる一冊をダウンロード(しかもスクリプトなどで機械的に)する輩があらわれる
それこそサイト側がCAPTCHAなり導入すればいいと思うんだが。
契約違反だろうがどっちが悪かろうが、自動化対策、クローラ負荷対策にCAPTCHA入れるって大手サイトならどこでもやってる常識レベルの対応じゃね?
人間が数本ずつ論文読む程度ならCAPTCHAも苦ではないだろ。
FireFox (スコア:0)
ってなんですか?