パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

CCCが運営する海老名市立図書館の公式サイトは「無断リンク禁止」」記事へのコメント

  • by Anonymous Coward on 2015年10月06日 16時42分 (#2894959)
    Googleなどからの事前連絡はあったのでしょうか。
    • by Anonymous Coward

      User-agent: *
      Crawl-delay: 10
      # Directories
      # 2015.08.17 ADD start
      Disallow: /

      https://ebina.city-library.jp/library/robots.txt [city-library.jp]

      お断りします

      • なんか、嫌な雰囲気な robots.txt ですね。

        Disallow: /cron.php
        Disallow: /INSTALL.mysql.txt
        Disallow: /INSTALL.pgsql.txt
        Disallow: /INSTALL.sqlite.txt
        Disallow: /install.php
        Disallow: /INSTALL.txt
        Disallow: /MAINTAINERS.txt
        Disallow: /update.php
        Disallow: /UPGRADE.txt
        Disallow: /xmlrpc.php
        Disallow: /admin/
        Disallow: /?q=admin/

        あたりは、管理用のプログラム等だと思われますが、robots.txt でクロールを拒否する以前に、そもそもWeb公開用のディレクトリ(public_html)以下に置くべきものではありません。アクセス時に適切に認証を要求していたとしても cron.php は余計だし、ルートに install.php なんてのを設置しているのはセンスを疑います。

        User-agent: *
        Crawl-delay: 10

        については、動的ページの過剰クロールでダウンしないようにするためだと思われますが、検索エンジン事によって単位が分だったり秒だったりする [xrea.com]ので、アスタリスクで全ロボットに対して一律に記述するのは不適切です。

        設置場所がroot [city-library.jp]ではなくサブディレクトリ [city-library.jp]なのも駄目ですね。

        親コメント
        • by snurf-kim (10835) on 2015年10月06日 19時49分 (#2895097) 日記

          >なんか、嫌な雰囲気な robots.txt ですね。

          おそらく、それはDrupal付属の robots.txt です。
          https://api.drupal.org/api/drupal/robots.txt/7 [drupal.org]

          #「This file is to prevent the crawling and indexing of certain parts」で検索したら引っ掛かった。

          >設置場所がrootではなくサブディレクトリなのも駄目ですね。

          サブディレクトリにある理由は、単にDrupalの配置先にDrupal付属の robots.txt があるってだけで、サイト製作者が作って置いたものではない様子。

          なので、私は件のサイトには検索避けの robots.txt は置かれていないと判断します。

          親コメント
          • おそらく、それはDrupal付属の robots.txt です。
            サブディレクトリにある理由は、単にDrupalの配置先にDrupal付属の robots.txt があるってだけで、サイト製作者が作って置いたものではない様子。

            なるほど。

            サイト管理者が意図して設置したわけではなく、CMSのパッケージに含まれていた robots.txt をそのままアップロードしただけでしたか。

            親コメント
            • by Anonymous Coward

              ところで Drupal って設定ファイルの場所を変更できないの?
              コンテンツフォルダ配下に置くってデンジャラス過ぎるでしょう。

              Apacheのアップデートしたときに、
              PHP がそのまま表示されちゃうとかいう落ちは勘弁。

        • by Anonymous Coward

          これって「国立国会図書館法によるインターネット資料の収集」は
          できるのかな?

          • by Anonymous Coward

            robots.txtって置いてあるだけだもん

        • by Anonymous Coward

          サブディレクトリに置かれたrobots.txtがサブディレクトリに置くなって警告してくれてる

          # This file will be ignored unless it is at the root of your host:
          # Used: http://example.com/robots.txt
          # Ignored: http://example.com/site/robots.txt

          この三行のほうが面白い。

          まぁ既にコメントついてる通り、サンプル的なファイルだから制限の意図も意味もなさ気ですが。

      • by Anonymous Coward on 2015年10月06日 17時38分 (#2895003)

        でも、トップディレクトリにおかんと意味なかろうw

        https://ebina.city-library.jp/robots.txt [city-library.jp] not found

        親コメント

Stableって古いって意味だっけ? -- Debian初級

処理中...