パスワードを忘れた? アカウント作成
15835719 story
人工知能

NovelAI、イラスト無断転載サイトを学習データに使用か? 119

ストーリー by nagazou
いろいろズレまくり 部門より
AI画像合成の話題が続くが、こうしたイラストAIサイトの一つ「NovelAI」が、海外の「danbooru」という画像サイトを学習データに利用しているとして問題となっているようだ。「NovelAI」は、高品質なアニメ画像を出力できることで人気がある。しかし学習データの元となったDanbooruは他人の画像を無断掲載している疑いが持たれ、イラスト版漫画村などと呼ばれてもいるという。さらに、NovelAIは有料サービスがメインであることから、盗用した画像を学習データに使用して商売するとは何事かと炎上することになったようだ (Togetter)。

NovelAIは9月25日に公式Twitter上で「Danbooruで訓練していることから、キャラクター名とそのビジュアルも学習する」と説明している。具体例として「reゼロから始める異世界生活」の登場人物の一人である「レム」を元にした生成画像を掲載している(NovelAI公式のツイート)。

ITmediaの記事によると、これに関連して学習データのもととなった「Danbooru」側もNovelAIは無関係であると主張する声明を発表しているそうだ。声明は英語と日本語で出され「われわれがNovelAIに関係していないことと、彼らがしてることを、支持はおろか容認もしていない」とする内容だという。また、NovelAIはDanbooruに掲載されていない絵であっても、PixivやTwitterからもイラストを収集している可能性が高いと指摘しているとのこと(ITmedia)。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2022年10月29日 8時52分 (#4351900)

    すらどのサイトが落ち気味とはいえネタ古くない?

    • by Anonymous Coward

      これの続報も含めた現状まとめかと思って開いたら、これだけだった…

      スラドではよくあること

    • by Anonymous Coward

      流出騒動や海賊サイトが記事になるのは一か月後ぐらいかな

  • 今ちまたで流行中のイラストAIって、原理的に雑コラの延長にしかなれない。
    著作権のある素材を学習させるなら、なにをどう指定しようと他人が権利を持つ素材をコラージュしたものが出てくる。

    学習させるところまでは別に問題はない、というかそこを制限するとまっとうな研究も出来なくなる。法的にもそこは問題視されないはず。

    ただ、他人が権利を持つ素材をコラージュするだけのbotを一般公開するのはダメだろう。そんなの無断転載botと同じだ。
    逆に、パブリックドメインもしくは明示的に許諾を得た素材のみを使うのであれば一般公開しても良い、とするのが筋じゃないかと思う。

    深層学習タイプのAIはどこまで行ってももそういう道具でしかないので、問題になるのは使い方。そこを考えないまま安易に一般公開なんてするから今みたいな騒動になるんじゃないかね。

    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
    • by Anonymous Coward

      公開したらダメだけど使うのはいいの?それもまた変な話

      • 著作権って、条文読めばわかるけど、ほとんど全てが著作物の特定の使い方を制限する権利の集合体。
        だから、どう使うかが最終的に問題になる。

        多くの使い方において、学術研究用途なら問題ない、みたいな例外規定があるので、AIに食わせるだけならOKとなってたはず。

        ただ、それはあくまで「AIを作る」までの話であって、AIに何かを作らせるなら、別の権利規定に従う必要がある。
        で、ネットに公開するというのは、複製権、公衆送信権ほか複数の権利に引っかかるので、許諾がとても取りにくい。なので、学習素材の権利をクリアにしない限り、一般公開はNGとしないとダメだろう、と言うこと。

        --
        しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
        親コメント
        • 見た目は雑コラ的にはなりますが、内部的にはコラとは違うのはあるのと...

          あと利用規定については、著作権法がなにも言ってはくれない気がするので、難しいですね。

          --
          M-FalconSky (暑いか寒い)
          親コメント
  • danbooruを使用したのは効率化のため? とすればpixivやTwitterから直接学習すれば効率は落ちるものの結果としては同じだし、絵師側は止めようがないのでは?
    スクレイピング禁止規約との関係が問題になるかもしれないけど「盗用した画像を学習データに使用して商売するとは何事か」っていう批判は成立しなくなっちゃうよね

    • danbooruは絵に対するタグ付けがかなり詳細なのが有用だそうな。
      pixivなんかはタグの数自体少ないから、大まかなジャンルタグが付くだけ。

      danbooruって転載元のURLも載ってるみたいだし
      タグだけdanbooruから収集して絵はpixiv/twitterから引っ張ってくるって方式にすれば、結果はほぼ変わんないと思うよ。

      親コメント
      • by Anonymous Coward

        ネットに上がってる=学習に使って良い ならそれでも良いんですがね……

        • by Anonymous Coward

          著作権法改正の結果、一般に公開されたものは学習に使ってよいということになったわけですし
          学習に使われたくないならば公開しないでくださいとしか…

        • by Anonymous Coward

          使って良いんだけど・・・

          • by Anonymous Coward

            少なくとも責任を取るべきは無断転載サイト側だよね。

            法律上、AIの学習データとして使って良い、という話に、「違法な転載は除く」とか「適法に掲載されたモノのみ」という制限はないわけだし。

            そもそも利用者側が、適法な掲載か確実にチェックする方法がない。

    • by Anonymous Coward

      過程がずいぶんちがうんじゃないかな。

      店に置いてあるものを黙って持っていくのと、 盗品かもしれないものが「ご自由にお持ちください」と置かれているのを持っていく、程度には違う。

      • by Anonymous Coward

        かつて書籍の自炊代行業者がそれに近い話になってましたね。

      • by Anonymous Coward

        またそういう意味のない例えを…
        そもそもその店で売る場合にしたって、著作権の場合は文化の発展のため限定的に認められてるに過ぎないんだよ。
        しかもデジタルならコピーしてもオリジナルは残ったまま影響もない。
        誤解を生むようなズレた例えは百害あって一利なしだよ。

  • by Anonymous Coward on 2022年10月29日 8時57分 (#4351905)

    ちょっと前にハッキングによりNovelAIの学習データもソースコードも流出してばらまかれたので界隈は大盛り上がりになってますし、
    わざわざお金払って使ってるのはローカルで動かせない一部の人くらいしかいないのでは。
    あれこれ試してますけどもすごいですねこれ良い時代になったものだ…

    • by Anonymous Coward

      商売としてやるなら個人の画風特化のmimicの方がまだ目がありそうなんて一ヶ月前は予想もできなかったな。

      • by Anonymous Coward

        海外ではさらに絵師別にデータ喰わせて学習させたモデルデータも配布中です

    • by Anonymous Coward

      高性能馬鹿が金の卵を産むガチョウの卵を産んでは潰す風景。

      • by Anonymous Coward

        まるでコピーレフトが真に実現した世界みたいじゃないか
        とても興味深いよ

    • by Anonymous Coward

      そのソースコード自体も機械学習のために使用するなら問題ないですよね。ネットに上がってますし。

      • by Anonymous Coward

        そうだけど、GitHubあたりから集めた方が良いと思うよ。
        主に量の問題で。

  • by Anonymous Coward on 2022年10月29日 9時26分 (#4351924)

    無断転載かどうかはともかく、殆どはインターネットに公開されてるものなんだから、それを取り込むかDanbooruから取り込むかの違いだけだよね。
    書いてあるようにPixivとかTwitterとかね。
    いくらか経路が違うかどうかに過ぎないと思うわ。
    しかも本邦内に限って言えば機械学習のためのデータ入力は著作権保護の対象外になっている。
    学習禁止を謳って公開されたイラストが多少増えたところで、勝手に学習されてしまうよ。

    • by Anonymous Coward

      そんな経緯のことなんて著作権者からすると知らんがね。

      • by Anonymous Coward

        確かに機械学習のデータにされることは著作権法に守られているから、手出しできないし知ったことではないですね。

      • by Anonymous Coward

        知らんか知ってるかに関わらず、著作権者と言えど放っておく以外は何も権利主張できないですよ。
        学習は著作権保護の対象外だから。

  • by Anonymous Coward on 2022年10月29日 12時25分 (#4352000)

    新しいイラストをアルゴリズムに対する保護対象にするとか、活動中の特定の誰かの真似をする行為を禁じるとかすれば、少しは沈静化するのにね。そうすれば、絵師は画風を進化させ続ければ良いことになる。DVDレンタル業者のルールを決めた時のように、双方の商売が成り立つようなルールを考えてほしい。

    • by Anonymous Coward

      イラストだけで良いのかと言う話になるよね。
      どこまで対象にするのかと言いはじめると収拾つかなくなっちゃう。

      • by Anonymous Coward

        どこまでも対象ではないんですよ現状では。

    • by Anonymous Coward

      真似してると認められるほど本質的な特徴を模倣しているなら、従来の枠組みで十分対応可能でしょう。

  • by Anonymous Coward on 2022年10月29日 12時30分 (#4352003)

    日本だと海賊版のダウンロード自体が違法。
    danbooruに違法うpされている画像データが多いということを知っているなら故意にダウンロードすることになるから
    AIの学習データに使うという目的以前にダウンロードした時点でアウトかな。

    アメリカなどだとフェアユースという概念があるからダウンロードも学習データとしての利用も認められる可能性が高い。
    特に研究機関だと認められやすいからロンダリングが流行してるという批判もある。

    >「AI学習用のデータセット作成を大学や非営利団体に任せることで企業は法的責任から逃げている」という批判

    > 大学などの研究機関や非営利団体によってデータ収集とモデルの学習が行われている場合、
    > アメリカの著作権法で認められているフェアユースに該当する可能性が高い
    https://gigazine.net/news/20221019-ai-data-laundering/ [gigazine.net]

    • by Anonymous Coward

      それ(海賊版であることが明白)はどこかではっきりされてるんでしたっけ?
      曲がりなりにも建前は作成者本人か権利保持者のアップロードに限られますよ。
      しかも権利者が異議言えば削除もされる。
      玉石混交のサイトはいっぱいあるし、例えばYoutubeと何が違うんでしょうか?

      • by Anonymous Coward

        権利者が削除できるとか建前上は権利者がとかは関係ないし、YouTubeでもどこでも同じ。

        #漫画村類似サイトはいまだにたくさんあるけど違法かどうかわからない。過去の前例や権利者がそんなとこに許可出すわけがないという考えを元にみんな勝手に違法サイト認定してる。ダンボールもある意味でそれと似たようなもの

        • by Anonymous Coward

          Youtubeの動画から学習してるGoogleのAI、止まるといいですね。

          • by Anonymous Coward

            明らかに国内著作権法違反だった時代のGoogleやYouTubeを批判したら
            大方の反応が「日本法・日本人・日本企業が時代遅れ」だったのを思い出したわ。

            やってることは同じ(どころか、さらに大規模な無断使用)なのに。

            • by Anonymous Coward

              今回このストーリーも時代遅れの反応だと思ってるよ。
              日本なんか法律まで整備したのに、何を今更言ってるんだか。

        • by Anonymous Coward

          ぼくのかんがえたさいきょうの違法サイト。

        • by Anonymous Coward

          じゃあDanbooruじゃなくて公式のブックストアから買った本なら学習させてOKということにしたいのですか?
          その場合のダウンロードは?学習処理内での複製は?違法ですか?
          著作権侵害は親告罪で、公式から買おうが細かい規約は著作権者の胸先三寸ですよ。
          そういった権利処理の煩雑さをなくすため機械学習の例外規定が設けられたのですから、そもそもの指摘が失当です。

  • by Anonymous Coward on 2022年10月29日 13時53分 (#4352028)

    最近CloudFlareのbotチェック入るようになりましたもんね

typodupeerror

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

読み込み中...