アカウント名:
パスワード:
この問題、対処は簡単です。
AIが生成した画像をクエリにして学習データに似た画像があるかないか画像検索を行うモジュールを追加して、似た画像があればその画像はユーザに見せない、ってやるだけ。
技術的には、画像検索のアルゴリズムなんていくらでもあって例えば20年ぐらい前に流行ったSIFT特徴量みたいな古典的なアルゴリズムを使うだけでも実用レベルで動作します。さらに古典的と言ってもハッシュベースの手法だから、クラウド使えば容易に負荷分散できる。スケールアウトできる。
特許はチェックする必要があるだろうけど、技術的問題は既に全部解決していると言っても過言ではないでしょう。つまり、この話は問題提起としては成立しているけど、対処が簡単だから大した脅威にはならないです。
そう簡単ではない。使えば分かるが、対象オブジェクトの生成とレイアウトがどこかで大きく分岐しているので、対象オブジェクトは、ほぼどこかのコピペ、但しポーズやレイアウトだけは異なる、という二次創作画像が頻繁に生成される。「画像全体として似た画像」はなくても、「構成する要素はほぼ元ネタのまま」が出来るだけなので、似た画像をカットする手法だけでは、解決にならないと考えられる。
さらに、手だけ変、みたいな一部分だけが元画像と異なるものも生成されやすく、「画像から切り出したオブジェクトデータベースと似たもの
別ACですが、おすすめの『 dragon ball z 』試してみましたが。。。苦笑いしかできない。
やはり、特定の作品を指定すると同じものしか出てこないのは、当たり前のことで、『 munch scream 』や『 monalisa picasso 』でも似たような結果。
毎回毎回違うので、同じ結果とは限りませんが、『 scream of munch, picasso style 』だと近いけれど少し違う。comic とか追加すると別物になった。
作品名で同じ、似ているモノが出てくるのは避けられないかと。あまり似ていなければ、別物だと人間が認識してしまうだろう。
#だた学習内容に偏りがるのか、日本語が得意でないのか、日本語で織田信長や某池波正太郎作品名と歌舞伎役者名を入れたが関係ない人物や風景、犬が出てきた。
ChatGPTなどでは労働者の精神的な負担や苦痛が問題になっているが、人件費の安い国(日本も?)で人間が介入して一定のメタデータ付けや、明らかなエラーやNG作品でエロ系、違法、公序良俗に反する内容の選択を人力で学習させる必要があるかも。
以前なら日本語という障壁があったけれど、翻訳ソフトの急速な進化により一定のレベルまでは出来てしまっているかな。
#大昔、GIMPのサイトからリンクされていたアメリカ政府機関の海洋関係の写真のタグ付けを暇つぶしに時々していたが、写真に写っている内容の理解よりも、内容を英語で入力するのが一番の問題だった。
NARUTOもお勧め…は置いといて、学習内容に偏りがあるのは日本に限らず、Apple Logoはほぼそのまま出るのに、Power Buttonのアイコンなど、規格が決めているものにも関わらず、容易に出てこなかったりする。
英文字はSONYとか容易に出るのに、かな漢字は一つも出ないとか、記号的なものがアルファベットに特化される形に過学習されてしまっている弊害も起きていそう。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
未知のハックに一心不乱に取り組んだ結果、私は自然の法則を変えてしまった -- あるハッカー
対策は簡単 (スコア:0)
この問題、対処は簡単です。
AIが生成した画像をクエリにして学習データに似た画像があるかないか画像検索を行うモジュールを追加して、似た画像があればその画像はユーザに見せない、ってやるだけ。
技術的には、画像検索のアルゴリズムなんていくらでもあって
例えば20年ぐらい前に流行ったSIFT特徴量みたいな古典的なアルゴリズムを使うだけでも実用レベルで動作します。
さらに古典的と言ってもハッシュベースの手法だから、クラウド使えば容易に負荷分散できる。スケールアウトできる。
特許はチェックする必要があるだろうけど、技術的問題は既に全部解決していると言っても過言ではないでしょう。
つまり、この話は問題提起としては成立しているけど、対処が簡単だから大した脅威にはならないです。
Re: (スコア:4, 興味深い)
そう簡単ではない。
使えば分かるが、対象オブジェクトの生成とレイアウトがどこかで大きく分岐しているので、
対象オブジェクトは、ほぼどこかのコピペ、但しポーズやレイアウトだけは異なる、
という二次創作画像が頻繁に生成される。
「画像全体として似た画像」はなくても、「構成する要素はほぼ元ネタのまま」が出来るだけなので、
似た画像をカットする手法だけでは、解決にならないと考えられる。
さらに、手だけ変、みたいな一部分だけが元画像と異なるものも生成されやすく、
「画像から切り出したオブジェクトデータベースと似たもの
Re:対策は簡単 (スコア:0)
別ACですが、おすすめの『 dragon ball z 』試してみましたが。。。苦笑いしかできない。
やはり、特定の作品を指定すると同じものしか出てこないのは、当たり前のことで、『 munch scream 』や『 monalisa picasso 』でも似たような結果。
毎回毎回違うので、同じ結果とは限りませんが、『 scream of munch, picasso style 』だと近いけれど少し違う。comic とか追加すると別物になった。
作品名で同じ、似ているモノが出てくるのは避けられないかと。
あまり似ていなければ、別物だと人間が認識してしまうだろう。
#だた学習内容に偏りがるのか、日本語が得意でないのか、日本語で織田信長や某池波正太郎作品名と歌舞伎役者名を入れたが関係ない人物や風景、犬が出てきた。
ChatGPTなどでは労働者の精神的な負担や苦痛が問題になっているが、人件費の安い国(日本も?)で人間が介入して一定のメタデータ付けや、明らかなエラーやNG作品でエロ系、違法、公序良俗に反する内容の選択を人力で学習させる必要があるかも。
以前なら日本語という障壁があったけれど、翻訳ソフトの急速な進化により一定のレベルまでは出来てしまっているかな。
#大昔、GIMPのサイトからリンクされていたアメリカ政府機関の海洋関係の写真のタグ付けを暇つぶしに時々していたが、写真に写っている内容の理解よりも、内容を英語で入力するのが一番の問題だった。
Re: (スコア:0)
NARUTOもお勧め…は置いといて、
学習内容に偏りがあるのは日本に限らず、
Apple Logoはほぼそのまま出るのに、
Power Buttonのアイコンなど、
規格が決めているものにも関わらず、
容易に出てこなかったりする。
英文字はSONYとか容易に出るのに、
かな漢字は一つも出ないとか、
記号的なものがアルファベットに特化される形に
過学習されてしまっている弊害も起きていそう。