パスワードを忘れた? アカウント作成
15425031 story
アナウンス

pixiv、サーバー負荷軽減のため小説作品の「本文」対象検索を提供終了へ 62

ストーリー by nagazou
確かに小説全文はきつそう 部門より
pixiv事務局は16日、創作系SNSであるpixivのサーバー負荷軽減のため、「本文」を対象とする検索サービスの提供を行うと発表した。リリースによれば、pixivに投稿された全ての小説作品における本文の総文字数は700億文字を超え、これが検索機能全体に大きな負荷をかけていたという。また検索結果に表示も時間がかかるなどの指摘が出ていた。根本的な解決の見込みがないことから、機能の提供終了という判断に至ったとしている(pixiv事務局)。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2021年09月21日 13時40分 (#4116558)

    本文検索サービスを有料オプションとして提供しても、使う層は一定以上いるはず。
    その増収を鑑みても、コストの増大をペイできないレベルだったんだろうか。

    • by Anonymous Coward on 2021年09月21日 18時53分 (#4116777)

      (突然の有料オプション化による)反発防止と反応確認のため一時無効化から、
      有料オプションとして復活とか

      親コメント
    • by Anonymous Coward

      ヒットしたワード1つにつき100円、自動引き落とし

    • by Anonymous Coward

      サードパーティーの「pixiv全文検索」がスタートしたりして

    • by Anonymous Coward

      pixivプレミアム限定サービスにすればプレミアムにする人が増えたかもしれないのに…

    • by Anonymous Coward

      今からでも有料ユーザー向けで追加すればいいんじゃね

    • by Anonymous Coward

      その声を待ってるところ

  • by Anonymous Coward on 2021年09月21日 14時03分 (#4116589)

    ユーザーがランキングやゴリ押しを無視して勝手に好きな作品を探すようになったらビジネスがやりにくくなる

    • by Anonymous Coward

      それって誘導する意味ある?
      検索であれたくさん読まれている作品が良い作品なのでは?

      • by Anonymous Coward

        せやな
        マックのハンバーガーとコカコーラは世界一良い食べ物だな

        • by Anonymous Coward

          世界一はラピュタパンやろ

        • by Anonymous Coward

          >マックのハンバーガー
          今年はまだ月見バーガー食べてないわ

        • by Anonymous Coward

          マックの中で、素のハンバーガーは一番ではなさそう

    • by Anonymous Coward

      題名がまたぞろ長くなるだけですな
      推しラインに乗ったらツーフレーズ愛称用意してもらえる感じで

  • by Anonymous Coward on 2021年09月21日 13時45分 (#4116567)

    700億文字=2バイト換算ざっくり140GB、昔だったらともかく、2021年現在だと音を上げるの早くね?

    #って思ってしまうのはインターネット老害志向だと自分でも思う。

    • by Anonymous Coward

      全部メモリに乗せることすら出来る容量だし、何に苦しんだのだろうか?

      • by Anonymous Coward

        独自の検索系サイトはBotアクセスが大量に来るので
        スロットリングとかちゃんとやらないと結構面倒なのでは。
        Bot向けにサーバ増設するのもあほらしいし。

      • by Anonymous Coward

        収益に寄与してないと判断されたかな。
        大改修掛ければパフォーマンス上げられるのは分かってて、でもそこに掛けるコストに意味が見出せないとか。

    • by Anonymous Coward

      💓とか使うと4バイトだし、いっぱい使われてそう(偏見

    • by Anonymous Coward

      UTF-8なら1文字平均3バイト前後でしょう。
      とは言えpixivのバックエンドならお茶の子さいさいでしょうに。

      • by Anonymous Coward

        世の中に先駆けてUTF-128 [ietf.org]で保存している可能性について。

    • by Anonymous Coward

      PIXIV司書さんが検索内容読んで、自分の記憶の中から小説を特定して、その小説をPIXIVで検索して、でてきた小説を読んでページを特定して、検索結果ページを作って、サーバに上げてたから時間がかかってたんだと思われる。

  • by Anonymous Coward on 2021年09月21日 13時51分 (#4116576)

    こういうのは登場した検索ワードを使ってサーチ対象をインデックス化するものではないの?
    毎回ベタgrepしてたんだとしたら相当なもんだ

    • by Anonymous Coward on 2021年09月21日 15時57分 (#4116668)

      ウェブ系で人気のMySQLとかならもう公式に全文検索に対応してると思うけどね。
      一昔前は半角スペース区切りのワードに分けてインデックスされる仕様だったから日本語はダメだったけど(mroongaとかならいけた)
      今はもうできるはず。

      もうGoogleさんに任せた方が楽では。

      親コメント
      • by Anonymous Coward

        アカウントがないと表示できないからGoogleはインデックスしてくれない

      • by Anonymous Coward

        今時は、何も考えずに全部Elasticsearchに突っ込んでおけばOKです。

    • by Anonymous Coward

      昔なら Tokyo Cabinet とか使いますよね。今は商用DBなら相当のものがあり。

    • by Anonymous Coward

      最近はクラウドの全文検索のSaaSに突っ込んでおけばいい感じにやってくれそうですし、技術的な要因というよりは経営的な判断があったんじゃないですかね。

  • 検索はGoogleに任せるというのではいかんのか?

    • by simon (1336) on 2021年09月21日 15時21分 (#4116648)

      検索はGoogleに任せるというのではいかんのか?

      男性向けはともかく、女性向け二次創作だと「公式から認識されたくない」タイプの創作があるそうなので
      Googleにクロールされると困るという作家さんがいるんだとか

      そういう書き手さんはGoogleが来たら作品消しちゃうという逃げ足の早さがあるんだとかなんとか
      難しいですね

      親コメント
    • by Anonymous Coward

      検索はGoogleに任せるというのではいかんのか?

      というか
      {query} site:pixiv.net
      で検索窓に仕込んで
      Powered by Googleって書いて
      廃止でなくてリニューアルにすればいいだけなような。。。

      • R-18小説はログインしないと冒頭説明部分しか見れないから無理でしょ
        Googlebotを騙すとか方法はあるけどさ

        親コメント
        • by Anonymous Coward

          > Googlebotを騙す

          騙してることがバレるとcloakingとしてGoogle八分を食らう

        • by Anonymous Coward

          楽天だったかな、ヤフオクだったかな、Google検索に18禁コンテンツが引っ掛かるけど、そのリンクを踏むと
          18禁はログインしないと見れませんみたいな表示が出てきたことがあったように思うんだけど、
          あれってGoogleはどうやってログイン先のコンテンツをクロールしてるんだろう。

          • by Anonymous Coward

            ピクシブもそういう挙動だった気がする。

    • by Anonymous Coward

      歌詞サイトなんか、Googleが検索結果で全部見せちゃうからサイトに来てくれなくなってんだろうなって思うんだけど、
      流石に小説全部を読めるようにはしないだろうが、いずれにせよ軸となるコンテンツをまるごと検索屋に複製されるのはサービスとして抵抗があるんじゃないだろうか。

  • by Anonymous Coward on 2021年09月21日 15時17分 (#4116643)

    本文冒頭の文がまるっきり逆なのに、誰の指摘もない・・・・(苦笑)

  • by Anonymous Coward on 2021年09月21日 15時43分 (#4116662)

    と思ったが、もう10年以上も更新されていないのか。

  • by Anonymous Coward on 2021年09月21日 22時04分 (#4116917)

    どうやら、腐女子界隈の「検索避け [pixiv.net]」なる独自文化が、機械検索を真っ向から阻害する方向で定着していたのも廃止の一因のようです。
    ※pixiv文芸創作のかなりの割合がこの界隈

    ・キャラクターや作品名を記載せず、隠語や代替語に置き換える
    ・単語の分割や逆読み、アナグラムを多用する
    ・カテゴリなどのタグは必ず外す
    ・感想はコメントでは無くタグに記載する(!)

    ぶっちゃけマトモにコストかけて改善するのが馬鹿らしくなったんじゃないかと。。

typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...