画像生成AI『DALL·E 2』、データセットの偏りを補正するための単純なハック実施 48
ストーリー by nagazou
全部に付けちゃうと別の問題がありそうだけど 部門より
全部に付けちゃうと別の問題がありそうだけど 部門より
AI技術では元となったデータセットの人種的比率などの影響により、偏った判断が行われることが問題となることが増えている。TechnoEdgeの記事によると、画像生成AIの「DALL·E 2」ではこの問題に関して、簡単なハック的な発想で学習の偏りを補正することに成功したそうだ(TechnoEdge)。
従来のDALLE 2は「英雄的な消防士」と入力すると結果は全員白人男性、「女性の肖像」に対しては全員白人女性となると言った問題が生じていた。そこで結果の多様性を確保するため、検索者が入れていない「女性」や「黒人」といった単語を指示に付け加えることで、先の「英雄的な消防士」の例ではアジア系やアフリカ系も、女性も結果に含むようになったという。
従来のDALLE 2は「英雄的な消防士」と入力すると結果は全員白人男性、「女性の肖像」に対しては全員白人女性となると言った問題が生じていた。そこで結果の多様性を確保するため、検索者が入れていない「女性」や「黒人」といった単語を指示に付け加えることで、先の「英雄的な消防士」の例ではアジア系やアフリカ系も、女性も結果に含むようになったという。
日本人の少女がおばさん顔になる (スコア:5, 参考になる)
DALL-Eに「多くの日本人少女が腕を広げて笑いながら空を飛ぶ」
(Many Japanese girls are flying in the air, spreading their arms, smiling.)
という文言に基づいて画像生成させたら、少女の服を着ている、笑顔のおばさんのたちが両手を上に広げてジャンプしている写真という結果になりました。
少女至上主義に補正を入れられた希ガス。
Re:日本人の少女がおばさん顔になる (スコア:1)
漫☆画太郎に「きららジャンプ描いて下さい」って発注したみたいな展開
Re: (スコア:0)
少しだけ女という、、、いやなんでもない、、、
"英雄的な消防士" (スコア:1)
Google先生に聞いてみたら骨壺をお薦めされた
https://www.amazon.co.jp/dp/B098F6LKYG [amazon.co.jp]
Re: (スコア:0)
成れの果て?
それとも、「英雄的な消防士は骨壺に収まった消防士だけだ」という皮肉か何か?
#谷山浩子の「偉大なる作曲家」を連想した。元曲はモンティ・パイソンだ。
独裁の誕生 (スコア:1)
それはそれでそういう補正の判断をする人 (組織) の恣意性が入り込む余地が出来ちゃうからあまり良い話でもないんだよな。
民主主義的にやったら多数派が有利になってしまうというのと、少人数の善性に頼って公平を維持するのとどちらがマシだと思う?
Re:独裁の誕生 (スコア:2, すばらしい洞察)
「あまり良い話でもない」というか、元記事は「こんな雑なハック、駄目だろ」という論調ですな。
何故かnagazouストーリーでは「成功」とかいう、元記事に存在しないキーワードが入っているけど。
……はっ。
これは、nagazou AIに流し込む際に、キーワードに「成功」とか付け足して、無理やり補正しているんでは!?
Re:独裁の誕生 (スコア:1)
いえ、TechnoEdgeの記事はそんな論調ではないですよ。ここで言う「ハック」は「上手くやる」、つまりポジティブな意味で、その手法自体は批判していません。
駄目出ししてるのはAIのハック前の挙動です。このあたり。
「あまり良い話でもない」かどうかについても最後の3段落できっちり触れていて、補正しない状態では明らかに偏っていたのだから、恣意性が入り込んだとしても元の状態より遥かにマシということです。
ちなみに編集者のIttousai氏はツイート [twitter.com]で
と述べていて、データセットの偏りや、それを補正するハックの是非といった高尚な話より、ハックの内容を暴いた研究者たちのハックにフォーカスを当てたいような雰囲気ですね。
Re: (スコア:0)
「ハック」といえば「その場しのぎの手抜き」のニュアンスじゃね
手抜きで問題ない仕事に対して使えばポジティブな意味に、丁寧な仕事が必要ならネガティブな意味に
画像生成bot自体はどうでもいいけど、目的は技術デモなんだから、どっちかというとネガティブなニュアンスの方のハックだと思う
Re:独裁の誕生 (スコア:1)
> 「ハック」といえば「その場しのぎの手抜き」のニュアンスじゃね
そんなニュアンスはないですよ。
じゃあ「ハッカー」は「手抜きする人」ですか?(そんなわけありませんよね)
ライフハックか何かからの連想ですかね。その認識は改めた方が良いですよ。
Re: (スコア:0)
上の人とは別の人ですが、自分たちの年代(40代以上?)は「その場しのぎの手抜き(ただし、十分な効果をもたらす)」のニュアンスが強いですよ。
ハッキング [wikipedia.org]
もとは英語のhackで、「たたき切る」「切り刻む」「耕す」などの意味を持つ。また、天水農法の一つにハック耕というものが存在する。ハック耕とは、森の一角を皆伐し、森を焼いてミネラルが豊富になった地面に棒で穴をあけ、そこに作物の種を植える。後は天水(自然に降ってくる雨水)を頼りにして作物が実るのを待つ、という原始的な農法である。
Re:独裁の誕生 (スコア:1)
引用部分はもちろん、その記事のどこにも「その場しのぎの手抜き」なんて書いてないんですよね
Re: (スコア:0)
自分も40代ですがそんな理解です。
山形浩生が昔書いてた文章を思い出した。
https://cruel.org/freeware/hack.html [cruel.org]
> 何か道具や家具をつくるときに、細かくノミやカンナやヤスリで仕上げなんかしないで、鉈でちょいちょいと刻んで手早くラフなものを作って、でもそれだってちゃーんと使えます、という話。最小限の努力で要求をきれいにクリアするものをつくりあげる、という感じ。そしてそれが、いかにもハッカーっぽいってこともわかると思う。
Re: (スコア:0)
それはhack/slashの意味合いの語源ですね。コンピュータ界隈のジャーゴンとしてのhackの語源は家具職人がやっつけで作るという意味のhackから来てます。
職人からするとやっつけで上手くいく物でも素人から見ればhack/slashしてるだけに見えるん出すよ。
Re:独裁の誕生 (スコア:1)
・文字を四角四面に受け取り「ニュアンス」が読み取れない
・自分で調べられない
愚者は経験に学び、賢者は歴史に学ぶ。
自分を成長させられるよう、夏休みを活かしてね。
Re: (スコア:0)
お、自己紹介かな?
Re: (スコア:0)
日本語版が「ハッカーズ大辞典」として出版されていたものです。
これによると、hachの項目 [catb.org]の一つ目に以下の様にあり、「うまくはないが手早い仕事」ということです。
1. n. Originally, a quick job that produces what is needed, but not well.
Originallyとあるのは、その他にも多くの意味があるということで、興味のある方は見てみるとよい
Re: (スコア:0)
スティーブン・レヴィー『ハッカーズ』はストールマンなどにインタビューしていますが、「うまくはないが手早い仕事」を「おふざけで」フォースのように崇高なもの扱いしたのが始まりのようです。
日本にはすずきひろのぶのような勘違いしたバカがいて、その悪影響がいまだに残っているわけです。
Re: (スコア:0)
自分が最初に知ったのが唯一の原義だと思い込み
あまつさえ確認もせずモヒカン振りかざすクセを
この夏休みに直してみるのもいいかも知れないね
Re: (スコア:0)
夏休みからなのか言葉を知らないキッズが増えてきちゃったね
「モヒカンを振りかざす」って言葉に思わず笑っちゃったよw
「○○を振りかざすモヒカン族 [wikipedia.org]」ならわかるけどさ
Re: (スコア:0)
「モヒカンムーブかます」みたいに、仕草としても普通に使えないか?
無理すればブーメランにも使えるしモヒカンって便利
Re: (スコア:0)
「ハック」「その場しのぎ」「手抜き」などで検索すると、それを肯定どころか否定する情報しか見つからない……。
オフィスの生産性上げる 「仕事ハック」思考|NIKKEI STYLE [nikkei.com]
What's a Hack? [cruel.org]によれば、
Re:独裁の誕生 (スコア:1)
民主主義的にやったら多数派が有利になってしまうというのと、少人数の善性に頼って公平を維持するのとどちらがマシだと思う?
パーソナライズ広告のオプトアウト的な運用でいいんじゃね
/*
現実の比率7:2:1を平等にするためにサンプルを1:1:1で入れるのは公平であるか否かとか
検索者や検索対象のお気持ちに忖度するのは機械の仕事なのかねぇ
*/
Re: (スコア:0)
そもそも「民主主義=絶対的な正義」というのが大きな誤解なわけで。
純粋な多数決なら少数派に負担を押しつける結果にしかならないし、投票する人に何らかの縛りをかけるならどうやってそうするかが問題になる。
民主主義には限界があって、その結果はしばしば正義からほど遠い物になるという認識をまず共有する必要があるな。
Re: (スコア:0)
今回の話は元が「被選挙権は白人男性のみ」みたいな状態だった訳だからねぇ。民主主義はAIにとって最も困難な分野だ。
Re: (スコア:0)
女性だったら大きな手術を受けるときに男性の外科医よりも女性の外科医に手術してもらいたいと思うだろうか?みたいな
Re: (スコア:0)
それは民主主義ではない。全体主義って言います。
民主主義の手続きを利用して、多数派重視の全体主義を行う、ってのが良くあるパターン。
投票者(この時点で少ない)の過半数の、その派閥の過半数の、って感じで少数に権力を握られてしまう。
民主主義の手続きにあるバグだね。
本邦でも最近問題になってる事象がコレ。よりによって外部勢力に政策を握られてしまっていた。
民主主義は少数側の意見も尊重しなければならない(鵜呑みにするわけではない)のであって、そこは議会などで討論してすり合わせる訳だよ。
その手続きがないなら、それは民主主義の殻を被った全体主義ね。
「少人数の善性に頼って
Re: (スコア:0)
・民主主義が衆愚政治を経て全体主義に陥り少数を弾圧するリスク
・少人数の善性に頼って公平を維持するはずが闇落ちして悪の独裁者になるリスク
どっちがマシ?
ってことだね。
少なくとも、政治のことであるなら我々自身が参加できて監視できて投票で行動できる前者の方がマシだね。
良い独裁者の闇落ちを止める手立てなんて俺ら持ってない。
ところが民主主義は「選挙で負けたほうが悪い」というシステムになってしまったので、「悪いのは独裁者」と言えるほうがマシなのですよ。
選挙で負けた側は、責任者=主権者である国民を非難して敵に回すことができないから、代表でしかない為政者を悪だと言うしかない。
政治責任とは違い、実際の統治においては、同じ自分の身しか考えない人間同士であっても、独裁者に権力が集中するより、「衆愚」は足の引っ張り合いをするから民主主義国家のほうがマシに思える状態になります。
Re: (スコア:0)
まぁそれが、衆愚政治を経て全体主義に至る、ってヤツだね>「選挙で負けたほうが悪い」
「悪いのは独裁者」と言えるほうがマシってのはどうなんだろなぁ…。
「私は当事者じゃないでーす。あいつがわるいんでーす」って言いたいだけだろ? 責任を負いたくない。
民主党政権時代にあったじゃん。「誰だあんな奴らに投票したヤツ。俺は投票しなかったぜ」みたいな。
こういう二項対立的な思考自体が、本来は民主主義的ではないはずなんだよね。
いわば衆愚政治的。
もーちょっとマシにならんかな、って思うんだが、民度()が上がらんことにはどうにもならんわなぁ…。
論理的思考とか、科学的検証とか、証拠に基づく議論とか、人類の進歩と調和とか。遠いな。
「人類の進歩と調和」って夢だよね…。届かないから夢なんだろうか。
#ミャクミャク様にでも祈るかね。
Re: (スコア:0)
じゃあ本来の民主主義ってなんなんだってね。
全有権者が投票するにしても、それぞれの有権者が自分にとって一番利益の大きな候補に投票すると正義の実現にはならないわけで、
民主主義って大きな欠陥を抱えてるんですよ。
Re: (スコア:0)
2項対立に帰結するバイナリ脳がダメなのは明らかだね。
サンプル収集方法やカテゴリー分別しての重み付け等、上手いアルゴリズムを考案するべきでしょう。
つまり多様性とは (スコア:0, 荒らし)
多様性とは最適解では無いって事?
Re:つまり多様性とは (スコア:1)
初期のAIで貸し付けの与信を行うと白人には低金利、黒人には高金利を出してきたという例があります。
AIの判断は過去の例からの学習に基づくものでした。
その後調整されたのですが、調整の結果、貸倒れしにくいと予測される人の金利は以前より高くなり、貸倒しやすい人の金利は安くなったということになります。確かにそこだけ見れば最適解ではないかもしれませんね。
調整の結果、多様性がある社会になったということで社会の安定という別の目的関数の値が大きくなったのかもしれません。
#こうすると「すべての人に同じ金利で」という流れになっていく気もしますが、今のところそういう感じではないですね。
Re: (スコア:0)
まあこの回答を見るにバカは入れないほうがいいな
Re: (スコア:0)
つまり多様性とは一部の多様性を訴える人に都合の良い解釈でしか無いんだね。
多様性とは多数の意見を覆す道具じゃないですよ。
Re: (スコア:0)
え、まさに多数者の独裁をひっくり返すための道具でしょ?
Re: (スコア:0)
すでに十分に多様性が失われている場では、恐らくそうなのでしょうね。
長い物には巻かれろ理論。
×偏りを持たせる ○偏りを加える (スコア:0)
何いってんだこいつ感しかない
何にでも「女性」「黒人」「デブ」と付けとけばいい (スコア:0)
アメリカのビル看板みたいに絶対セーフな絵面だけが得られよう
Re: (スコア:0)
ブランド物のポスターとか映画・アニメのキャストとか
むしろ属性として取り上げることで劣等認定してるフシさえある
確かに少年描かせると (スコア:0)
消臭力歌いだしそうな見た目になる。
自分でもそうする (スコア:0)
ディープラーニング系のAIって内部ブラックボックスで文字列から出力を出してくれるだけの仕組みが基本。
それで「偏見をなくせ」と言われてデータセットの側を弄るのも一つの手だが、手元に既に動くものをわざわざ捨てるのは馬鹿らしい。
なら単語一つ追加すりゃ楽だってのは分かるわ。
特にポリコレ的にも問題があるとは思えない。
Re: (スコア:0)
黒人と言うキーワードを勝手に付け加えた挙句に黒人白人の偏りが無く出てきたら
そのAIは信頼できるのか?
AIの中身がどーなってんのか知らんが (スコア:0)
単にSQLのクエリ投げて、クエリの条件が悪いからシステム的に勝手にWHERE句追加しましたみたいな。
プログラム的に間違ってると思うんだけどAI的には合ってんの?
Re: (スコア:0)
AI以前に社会的に「女性が少ないから女性を無理矢理女性を採りました」みたいなのが良いのかというのは甚だ疑問だけどね。
そうじゃないだろ。今まで長い産休を取られるのが嫌だから女性をわざわざ外してたんじゃないのか。
年取ってるだけで自分のことを偉いと勘違いした馬鹿が集まって決めるからそういう風になるんだろ。
そういうことをしてません、ちゃんと選考しましたということをあとで皆が確認できる仕組みこそが必要なんじゃないのか。
Re: (スコア:0)
合ってないから記事では悪い意味でハックと書いている。
AIのことはよく知らないが、蓄積してしまった学習データの偏りを誤魔化すための(駄目な)工夫ってのは、各所で行われてそうな気はする。
皆がやってるから正しいなんてことは、おそらくないが、ユーザーには簡単にはわからない。
Re: (スコア:0)
こんなやり方が正しいってんならグーグルの検索結果とかでも男女比が均等になるように調整すれば良いんだよ。
Re: (スコア:0)
アメリカで作られたAIならアメリカの実際の人種構成比率と出力画像のそれが一致しなければプログラム的に間違ってる
と思うのであれば、プログラム的に間違ってるんだろう
俺は、データセットが片寄ってるなら食わせたデータセットが片寄ってるって話なんだろうと思うが
#実際はプログラマとかデータ食わせた奴に意図があるのかどうかすら分からんけど
まあなさそうとは思う