
NovelAI、イラスト無断転載サイトを学習データに使用か? 119
ストーリー by nagazou
いろいろズレまくり 部門より
いろいろズレまくり 部門より
AI画像合成の話題が続くが、こうしたイラストAIサイトの一つ「NovelAI」が、海外の「danbooru」という画像サイトを学習データに利用しているとして問題となっているようだ。「NovelAI」は、高品質なアニメ画像を出力できることで人気がある。しかし学習データの元となったDanbooruは他人の画像を無断掲載している疑いが持たれ、イラスト版漫画村などと呼ばれてもいるという。さらに、NovelAIは有料サービスがメインであることから、盗用した画像を学習データに使用して商売するとは何事かと炎上することになったようだ
(Togetter)。
NovelAIは9月25日に公式Twitter上で「Danbooruで訓練していることから、キャラクター名とそのビジュアルも学習する」と説明している。具体例として「reゼロから始める異世界生活」の登場人物の一人である「レム」を元にした生成画像を掲載している(NovelAI公式のツイート)。
ITmediaの記事によると、これに関連して学習データのもととなった「Danbooru」側もNovelAIは無関係であると主張する声明を発表しているそうだ。声明は英語と日本語で出され「われわれがNovelAIに関係していないことと、彼らがしてることを、支持はおろか容認もしていない」とする内容だという。また、NovelAIはDanbooruに掲載されていない絵であっても、PixivやTwitterからもイラストを収集している可能性が高いと指摘しているとのこと(ITmedia)。
NovelAIは9月25日に公式Twitter上で「Danbooruで訓練していることから、キャラクター名とそのビジュアルも学習する」と説明している。具体例として「reゼロから始める異世界生活」の登場人物の一人である「レム」を元にした生成画像を掲載している(NovelAI公式のツイート)。
ITmediaの記事によると、これに関連して学習データのもととなった「Danbooru」側もNovelAIは無関係であると主張する声明を発表しているそうだ。声明は英語と日本語で出され「われわれがNovelAIに関係していないことと、彼らがしてることを、支持はおろか容認もしていない」とする内容だという。また、NovelAIはDanbooruに掲載されていない絵であっても、PixivやTwitterからもイラストを収集している可能性が高いと指摘しているとのこと(ITmedia)。
周回遅れ (スコア:1)
すらどのサイトが落ち気味とはいえネタ古くない?
Re: (スコア:0)
これの続報も含めた現状まとめかと思って開いたら、これだけだった…
スラドではよくあること
Re: (スコア:0)
流出騒動や海賊サイトが記事になるのは一か月後ぐらいかな
著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:1)
今ちまたで流行中のイラストAIって、原理的に雑コラの延長にしかなれない。
著作権のある素材を学習させるなら、なにをどう指定しようと他人が権利を持つ素材をコラージュしたものが出てくる。
学習させるところまでは別に問題はない、というかそこを制限するとまっとうな研究も出来なくなる。法的にもそこは問題視されないはず。
ただ、他人が権利を持つ素材をコラージュするだけのbotを一般公開するのはダメだろう。そんなの無断転載botと同じだ。
逆に、パブリックドメインもしくは明示的に許諾を得た素材のみを使うのであれば一般公開しても良い、とするのが筋じゃないかと思う。
深層学習タイプのAIはどこまで行ってももそういう道具でしかないので、問題になるのは使い方。そこを考えないまま安易に一般公開なんてするから今みたいな騒動になるんじゃないかね。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
Re: (スコア:0)
公開したらダメだけど使うのはいいの?それもまた変な話
Re:著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:2)
著作権って、条文読めばわかるけど、ほとんど全てが著作物の特定の使い方を制限する権利の集合体。
だから、どう使うかが最終的に問題になる。
多くの使い方において、学術研究用途なら問題ない、みたいな例外規定があるので、AIに食わせるだけならOKとなってたはず。
ただ、それはあくまで「AIを作る」までの話であって、AIに何かを作らせるなら、別の権利規定に従う必要がある。
で、ネットに公開するというのは、複製権、公衆送信権ほか複数の権利に引っかかるので、許諾がとても取りにくい。なので、学習素材の権利をクリアにしない限り、一般公開はNGとしないとダメだろう、と言うこと。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
Re:著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:1)
見た目は雑コラ的にはなりますが、内部的にはコラとは違うのはあるのと...
あと利用規定については、著作権法がなにも言ってはくれない気がするので、難しいですね。
M-FalconSky (暑いか寒い)
Re:著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:1)
されるかどうか総務省でも文科省でも裁判所でも判断されてないよね
されますわって断定口調で言ってるけどそう主張するだけの法令、省令、判例出してくれる?
なかったら「わからない」が正解だよね?
どういう根拠でもって断定しているのか根拠を示してくれ。
> 道具を使って、他と類似性のある著作物を作成して公開した場合、きちんと模倣で無いことを証明出来る様にしておかないと、裁判では反証が難しいですね。
逆でしょ、同じである事を証明しなきゃ行けないのは訴えた側なので模倣である証明されない限りは反証する必要が無い
似ているってだけじゃ権利侵害にならんのよ
その上で拡散モデルで作られているのでそう一致しただけの話であって使ってない(切り貼りしてない)ことは技術的に説明可能
やろうと思えば過程のノイズだらけの連続画像出せるからね
> 事実似てるのであれば、データとして使ってないという証明以外に確実な反論は無いですからね。
使うことは合法なので「モデルデータに使っている」っていう事は権利の侵害になりません
著作権法第三十条の四で認められてる行為、使っている=権利侵害ではない
> それに裁判内で、アルゴリズムとデータセットを用意して、同じ出力が得られないと、作為的な模倣が認められるかも知れないですね。
Seed値とか同じにして揃えれば出せるけど逆に言えば同じプロンプトで別な結果が出るのであればそれはAI絵師のオリジナリティとして認められるだけだろ
ただ著作権が自然人にしか認められてないのでAI絵師の出力結果の権利者は誰だ?にはなるけど。
https://zenn.dev/karaage0703/articles/946d4566e5f7f6 [zenn.dev]
この辺見れば分かるけどPR以降は出せるようになってる
> まぁ同じ出力が得られた場合は、今度はソフトウェア制作者側に、模倣の意図があるかどうかで、別の裁判になりそうですが。
いいえ、アルゴリズム的に出しているだけなので模倣の意図があったと証明されなければいけないので
アルゴリズム的に出している場合そこに模倣の意図があったかどうかの証明は無理です。
そもそも人間が絵を描くときにやっていることを逆算してやっているような物なので結局の所絵を描くという行為を単純化したらベクトルの合成で再現出来ましたに過ぎません
Re:著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:1)
言いたいことはわかるけど、そういう話じゃないんだ。現に、アウトプットされるデータの中には法廷で争うとちょっとまずいことになるケースもあったりするだろ? そうじゃないデータも作れます、では言い訳にならない。
現行法での法的な扱いを決めるのは最終的には裁判所で、そこにたどり着くまでの訴えとか、心証とかいろいろな要素で扱いが左右されたりするんだよ。
もちろん、新しく法で権利を定めることになったりしたら言うまでもないよな。
だから、本当に技術の発展を目指すなら、出始めのうちにうかつに世間様に悪者にされるようなやり方は避けるべきなんだよ。
悪意を持ってあかん使い方をしてそれを拡散させるような輩が出てしまうような提供の仕方は他でもないAI研究してる人たちの首を絞める行為なわけ。
しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
Re:著作権のある素材を学習させるなら一般公開はNGとするしかない (スコア:2)
人間が描いたデザインがアウトになる例も山程あるからねー。オリンピックのアレとか。
「描いたのが人間がAIか」ではなく、成果物で判断すべしとの意見に一票。
オリジナルから直接学習しても結果は同じことだよね? (スコア:0)
danbooruを使用したのは効率化のため? とすればpixivやTwitterから直接学習すれば効率は落ちるものの結果としては同じだし、絵師側は止めようがないのでは?
スクレイピング禁止規約との関係が問題になるかもしれないけど「盗用した画像を学習データに使用して商売するとは何事か」っていう批判は成立しなくなっちゃうよね
Re:オリジナルから直接学習しても結果は同じことだよね? (スコア:1)
danbooruは絵に対するタグ付けがかなり詳細なのが有用だそうな。
pixivなんかはタグの数自体少ないから、大まかなジャンルタグが付くだけ。
danbooruって転載元のURLも載ってるみたいだし
タグだけdanbooruから収集して絵はpixiv/twitterから引っ張ってくるって方式にすれば、結果はほぼ変わんないと思うよ。
Re: (スコア:0)
ネットに上がってる=学習に使って良い ならそれでも良いんですがね……
Re: (スコア:0)
著作権法改正の結果、一般に公開されたものは学習に使ってよいということになったわけですし
学習に使われたくないならば公開しないでくださいとしか…
Re: (スコア:0)
使って良いんだけど・・・
Re: (スコア:0)
少なくとも責任を取るべきは無断転載サイト側だよね。
法律上、AIの学習データとして使って良い、という話に、「違法な転載は除く」とか「適法に掲載されたモノのみ」という制限はないわけだし。
そもそも利用者側が、適法な掲載か確実にチェックする方法がない。
Re: (スコア:0)
過程がずいぶんちがうんじゃないかな。
店に置いてあるものを黙って持っていくのと、 盗品かもしれないものが「ご自由にお持ちください」と置かれているのを持っていく、程度には違う。
Re: (スコア:0)
かつて書籍の自炊代行業者がそれに近い話になってましたね。
Re: (スコア:0)
またそういう意味のない例えを…
そもそもその店で売る場合にしたって、著作権の場合は文化の発展のため限定的に認められてるに過ぎないんだよ。
しかもデジタルならコピーしてもオリジナルは残ったまま影響もない。
誤解を生むようなズレた例えは百害あって一利なしだよ。
もう商売にはならないのでは (スコア:0)
ちょっと前にハッキングによりNovelAIの学習データもソースコードも流出してばらまかれたので界隈は大盛り上がりになってますし、
わざわざお金払って使ってるのはローカルで動かせない一部の人くらいしかいないのでは。
あれこれ試してますけどもすごいですねこれ良い時代になったものだ…
Re: (スコア:0)
商売としてやるなら個人の画風特化のmimicの方がまだ目がありそうなんて一ヶ月前は予想もできなかったな。
Re: (スコア:0)
海外ではさらに絵師別にデータ喰わせて学習させたモデルデータも配布中です
Re: (スコア:0)
高性能馬鹿が金の卵を産むガチョウの卵を産んでは潰す風景。
Re: (スコア:0)
まるでコピーレフトが真に実現した世界みたいじゃないか
とても興味深いよ
Re: (スコア:0)
そのソースコード自体も機械学習のために使用するなら問題ないですよね。ネットに上がってますし。
Re: (スコア:0)
そうだけど、GitHubあたりから集めた方が良いと思うよ。
主に量の問題で。
そこまで経路が問題か? (スコア:0)
無断転載かどうかはともかく、殆どはインターネットに公開されてるものなんだから、それを取り込むかDanbooruから取り込むかの違いだけだよね。
書いてあるようにPixivとかTwitterとかね。
いくらか経路が違うかどうかに過ぎないと思うわ。
しかも本邦内に限って言えば機械学習のためのデータ入力は著作権保護の対象外になっている。
学習禁止を謳って公開されたイラストが多少増えたところで、勝手に学習されてしまうよ。
Re: (スコア:0)
そんな経緯のことなんて著作権者からすると知らんがね。
Re: (スコア:0)
確かに機械学習のデータにされることは著作権法に守られているから、手出しできないし知ったことではないですね。
Re: (スコア:0)
知らんか知ってるかに関わらず、著作権者と言えど放っておく以外は何も権利主張できないですよ。
学習は著作権保護の対象外だから。
法律が糞 (スコア:0)
新しいイラストをアルゴリズムに対する保護対象にするとか、活動中の特定の誰かの真似をする行為を禁じるとかすれば、少しは沈静化するのにね。そうすれば、絵師は画風を進化させ続ければ良いことになる。DVDレンタル業者のルールを決めた時のように、双方の商売が成り立つようなルールを考えてほしい。
Re: (スコア:0)
イラストだけで良いのかと言う話になるよね。
どこまで対象にするのかと言いはじめると収拾つかなくなっちゃう。
Re: (スコア:0)
どこまでも対象ではないんですよ現状では。
Re: (スコア:0)
真似してると認められるほど本質的な特徴を模倣しているなら、従来の枠組みで十分対応可能でしょう。
日本の法律ならアウト (スコア:0)
日本だと海賊版のダウンロード自体が違法。
danbooruに違法うpされている画像データが多いということを知っているなら故意にダウンロードすることになるから
AIの学習データに使うという目的以前にダウンロードした時点でアウトかな。
アメリカなどだとフェアユースという概念があるからダウンロードも学習データとしての利用も認められる可能性が高い。
特に研究機関だと認められやすいからロンダリングが流行してるという批判もある。
>「AI学習用のデータセット作成を大学や非営利団体に任せることで企業は法的責任から逃げている」という批判
> 大学などの研究機関や非営利団体によってデータ収集とモデルの学習が行われている場合、
> アメリカの著作権法で認められているフェアユースに該当する可能性が高い
https://gigazine.net/news/20221019-ai-data-laundering/ [gigazine.net]
Re: (スコア:0)
それ(海賊版であることが明白)はどこかではっきりされてるんでしたっけ?
曲がりなりにも建前は作成者本人か権利保持者のアップロードに限られますよ。
しかも権利者が異議言えば削除もされる。
玉石混交のサイトはいっぱいあるし、例えばYoutubeと何が違うんでしょうか?
Re: (スコア:0)
権利者が削除できるとか建前上は権利者がとかは関係ないし、YouTubeでもどこでも同じ。
#漫画村類似サイトはいまだにたくさんあるけど違法かどうかわからない。過去の前例や権利者がそんなとこに許可出すわけがないという考えを元にみんな勝手に違法サイト認定してる。ダンボールもある意味でそれと似たようなもの
Re: (スコア:0)
Youtubeの動画から学習してるGoogleのAI、止まるといいですね。
Re: (スコア:0)
明らかに国内著作権法違反だった時代のGoogleやYouTubeを批判したら
大方の反応が「日本法・日本人・日本企業が時代遅れ」だったのを思い出したわ。
やってることは同じ(どころか、さらに大規模な無断使用)なのに。
Re: (スコア:0)
今回このストーリーも時代遅れの反応だと思ってるよ。
日本なんか法律まで整備したのに、何を今更言ってるんだか。
Re: (スコア:0)
ぼくのかんがえたさいきょうの違法サイト。
Re: (スコア:0)
じゃあDanbooruじゃなくて公式のブックストアから買った本なら学習させてOKということにしたいのですか?
その場合のダウンロードは?学習処理内での複製は?違法ですか?
著作権侵害は親告罪で、公式から買おうが細かい規約は著作権者の胸先三寸ですよ。
そういった権利処理の煩雑さをなくすため機械学習の例外規定が設けられたのですから、そもそもの指摘が失当です。
danbooru側が嫌がってるのは知ってる (スコア:0)
最近CloudFlareのbotチェック入るようになりましたもんね
Re: (スコア:0)
Danbooruは一応絵師本人による投稿が前提という建前があったような。
なので絵師本人がアップロードしているものとして我々は閲覧しているわけですし。
もし無断アップロードされていた場合は絵師本人である証拠を提示して通報すれば対応してくれるはず。
権利者でもない人間にとってはどうしようもないことですもんね。
Re: (スコア:0)
そもそも本人が投稿したものだとしても無断盗用してるNovelAIが(海外で)問題なのはかわらないのでは?
Re: (スコア:0)
海外って、具体的に国を指定して話さないと、それぞれ事情が違うでしょ。
Re: (スコア:0)
問題視されて話題になっているというのに
日本の法律もちだして問題ないといいだす阿呆
Re: (スコア:0)
「問題視されて話題になっている」と「違法である」の違いがわからない人?
問題視なんてものは、外野が言いたい放題。
Re: (スコア:0)
巣に帰ってくれ
Re: (スコア:0)
で、それは具体的にどうおかしいの?
ロジックなりアルゴリズムなりで解説してよ。