米Yahoo!、ヘイトスピーチを正確に検出できるシステムを開発 77
ストーリー by hylom
ほこたて 部門より
ほこたて 部門より
今年3月、Microsoftの人工知能「Tay」が人種差別的な発言(ヘイトスピーチ)を話すよう学習させられてしまったことが話題になったが(過去記事)、今度は米Yahoo!がコメント内のヘイトスピーチを正確に識別する人工知能を開発したそうだ(WIRED、論文PDF)。
単に特定のキーワードを検出するだけでなく、文脈から判断して人種差別的な発言を検出できるのが特徴。人工知能の学習には、Yahoo! NewsやYahoo! Financeのコメントとして投稿されたテキストを使用したという。この人工知能は「訓練を受けていない人」よりも高精度でコメントを判断できることも実験で明らかにされているとのこと。このデータベースはYahoo!のWebscopeという研究者向けサイトで公開されるようだ。
予想される未来 (スコア:2)
政治家・有名人が問題発言→
擁護意見「発言の一部を切り取るのでは無く、全文を読め」→
当該AIに全文を入力したら「完全にアウト」の結果が
Re: (スコア:0)
こういう話 [netgeek.biz]を見ると、「完全にアウト」なのはマスコミだよねぇ
#このAIで「切り取られ、報道された発言」と「オリジナルの全文」をチェックして、ヘイトスピーチの度合いにどれくらい差が付くか、なんて調べたら面白そうだ
Re:予想される未来 (スコア:2)
いや、それこそ、全文だと逆にアチャーなパターンでしょう……。
丸山氏の言ってる事には、事実誤認が有って、オバマ大統領は、「アフリカ系」だけど「奴隷の子孫」では無いんですよ。(ケニアからの留学生と白人系のアメリカ人の間に生まれた子供)
だからこそ、「オバマは本当はアメリカ国籍を持ってない」「オバマは本当はイスラム教徒」みたいなデマを言う奴が居たり、予備選の時に、アフリカ系の人から「本当に貴方は、私達の仲間なの??」みたいな質問をされた訳で……。
Re:予想される未来 (スコア:2)
いや、だから、多分、人工知能に丸山氏の発言がヘイトスピーチか否かを判定させた場合、どっちの結果が出ようと、人工知能が何故、そう判断したかは、おそらく事実上判んない訳ですよね。
困った事に、今のところ、「何故、丸山氏の発言がヘイトスピーチか否か」を判定して、その理由を言語化出来るのは、人間だけ。
Re:予想される未来 (スコア:2)
いや、ガチで全文やると、丸山氏がやらかした、アチャーな事実誤認まで解説しないといけない以上、一部だけ切り取って済ますのも「武士の情け」って解釈も有り得ますよね。
私がマスコミ関係者だったら、丸山氏の事実誤認を微に入り細を穿って解説しますよ。全文を掲載した上でね。
と云うか、丸山氏の、この発言、当時は「日本がアメリカの51番目の州になる」も問題視された記憶が有るのですが、何故、そこはガン無視されるのですか??
貴方のマスコミ批判が妥当なら、そのマスコミと同じく、「一部だけ切り取り」「都合の悪い所はガン無視」をやってる、貴方は、一体、何をやりたいのですか??
さらに言うなら、丸山氏の例の発言は、与党内からも批判が有り、丸山氏も謝罪し、自民党も丸山氏を厳重注意処分にして、国会の議事録からも削除されましたよね??
だとしたら、与野党の少なからぬ議員のみならず、謝罪した丸山氏本人もマスコミの「虚報」を信じた訳ですか??
そう、何がヘイトスピーチかは、人間社会の都合で決まる事。そして、世の中に予想外の大きな変化が無い限り、「何がヘイトスピーチか」の規準は、厳しくなる事は有れ、緩くなる事は考えにくい。それらを考慮すれば、「丸山氏の例の発言を、人工知能がヘイトスピーチと判定するか?」と云う設問自体が無意味。
どんな答を出すのであれ、人工知能の内部の規準・データ・アルゴリズムetcが更新されないので有れば『ヘイトスピーチか否かを判定する人工知能』としては役に立たない。
それは、丸山氏の例の発言がヘイトスピーチであるかを、人間が判定する場合も同じ事。
「丸山氏の例の発言がヘイトスピーチか??」に「正解」が有ったとしても、今日の「正解」が、5年後,10年後の「正解」とは限らない。
Re:予想される未来 (スコア:2)
でも、ヘイトスピーチの大半は事実誤認に基いてますよね。
でも、当の丸山氏&自民党が、結局謝罪し、丸山氏は厳重注意処分ですよね。
貴方はマスコミが全面的に悪かったと言いたいらしいけど、「マスコミの被害者」の筈の丸山氏&自民党が「私が悪うございました」「ウチの丸山が阿呆な事を言いまして」と認めちゃってる。
どう云う事ですか、それ??
強要その他が考えにくい状況で、当人&その所属政党が非を認めている以上、丸山氏の発言は「一部を切り取ったマスコミの虚報」の例としては、あんまり筋の良いモノじゃないと思いますよ。他に適切な事例は多々有るので、それを提示し直しては、どうでしょうか??
Re:予想される未来 (スコア:2)
はぁ。
「切り取ったのは、マスコミの『武士の情け』である可能性も有るのでは??」と言ってる私に対して、そんな事を言っても反論になってないですよ。
私は「マスコミが恣意的に丸山氏の発言を切り取った事は、丸山氏に対してマイナスになったとは限らない」と考えてるけど、貴方は、そう考えてはいないようだ。
一致していない前提を一方的にまくし立てても、私に対して、「お前が前提にしてる事は間違ってる」って言ってる事にはならない。
Re:予想される未来 (スコア:2)
うん、だから、父親はケニア出身で、いわゆる「奴隷の子孫」なのは白人系の母親で、しかも明らかになったのは、大統領になって以降。
Re:予想される未来 (スコア:2)
なので、示してもらったリンク先の内容は、やっぱり丸山氏の事実誤認を証明するモノですよ。
丸山氏の認識:奴隷の子孫なのに大統領になれた
事実:奴隷の子孫と思われてなかった人が大統領になって、大統領になった後に調べたら、父方/母方の内、まさか「奴隷の子孫」だとは誰も思ってなかった方が、たまたま、「奴隷の子孫」だった
大統領選 (スコア:1)
候補者と応援者たちのスピーチやコメントをこれに突っ込んだら面白そう。
日本語はダメなんだろうけど都知事選のも突っ込んでたら色々引っかかってたりして。
Re: (スコア:0)
There's not a black America and white America and Latino America and Asian America
後略
主語による閾値 (スコア:1)
「ネオナチは見つけだして叩き潰せ」
「共産主義者は見つけだして叩き潰せ」
「白人警官は見つけだして叩き潰せ」
「移民推進派は見つけだして叩き潰せ」
「移民は見つけだして叩き潰せ」
「●●●政権支持者は見つけだして叩き潰せ」
「きのこ派は見つけだして叩き潰せ」
これらのパラグラフは、ヘイトスピーチかどうかの判定で同じスコアが出るのかなぁ、っていう疑問。
Re:主語による閾値 (スコア:2)
どう云う結果が出ても、「その人工知能が、そんなスコアを付けた原因は??」を解明するのは困難な気がします
Re: (スコア:0)
「汚物は消毒だ!」が前後の文脈で判定可能なら凄いですけど、どうなのでしょう。
今それが一番必要な国 (スコア:0)
米Yahoo!って韓国で営業してたっけ?(喩え英文に限るにせよ)
Re:今それが一番必要な国 (スコア:2)
日本語のサンプルとして、このツリーを提供しよう。
Re:今それが一番必要な国 (スコア:1)
例文がないとわかりにくいんだよね
https://ja.wikipedia.org/wiki/%E3%83%98%E3%82%A4%E3%83%88%E3%82%B9%E3%... [wikipedia.org]
ヘイトスピーチ(英: hate speech)とは人種、出身国、宗教、性的指向、性別、障害などに基づいて個人または集団を攻撃、脅迫、侮辱する発言や言動のことである。
リア充(集団)爆発しろ(脅迫)!
ホモ(性的指向)が嫌いな女子(性別)なんかいません(偏見)!
お前の母ちゃん(個人)でべそ(侮辱)!
ハゲ(障害)は恋愛対象外(排除)。
うどん県(出身国)うどん(宗教)食いすぎ(侮辱)。
Re:今それが一番必要な国 (スコア:2)
> うどん県(出身国)うどん(宗教)食いすぎ(侮辱)。
最近、政府が大阪人を侮辱しました。「米と粉モン一緒に食うな」と。
#お好み焼きはキャベツ料理なのでセーフ。
Re: (スコア:0)
本当にひどいことになってるな。こいつら本当に日本人?
Re: (スコア:0)
日本にもね
根拠の希薄な人格攻撃でストレス発散してるだけの現状はあまりにも酷い
Re:今それが一番必要な国 (スコア:1)
ネトウヨ連呼厨に対するヘイトはそこまでだ
Re: (スコア:0)
左翼が特にひどいよね。
Re:今それが一番必要な国 (スコア:1)
そうでもないんじゃない?
彼等はどちらかというとスピーチよりも暴力が得意だし。
Re: (スコア:0)
左翼よりも俗にいうサヨクとかパヨクがひどいよね。
Re: (スコア:0)
なんか、こういうコメントにプラスが付くのっていつもの不当モデレートなのか、
それともヘイトスピーチの良い例としてプラスモデレートなのか判断が難しいな。
Re: (スコア:0)
お約束のブーメランをありがとう。一番必要なのはどう見ても日本です。
Re: (スコア:0, すばらしい洞察)
日本人をチョッパリ(쪽발이)と呼び、天皇陛下を日王(일왕)と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。
例えるなら、新聞TVを含め、半島人を「チョン」と呼ばないと、社会的に抹消される状態という事。
「一番必要なのはどう見ても日本」など、明らかな捏造。
連中は米Wikipediaや、「Yahoo! News」や「Yahoo! Finance」の記事コメント等へも、同様な捏造投稿を組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が英文しか処理できなくても、充分有用な技術である。
Re: (スコア:0)
Google検索 日本人(일본인)13,500,000件 [google.co.jp]
Google検索 チョッパリ(쪽발이)170,000件 [google.co.jp]
ウェブ上からは韓国語の「日本人」という表現は駆逐されていないどころか圧倒的多数のようですが。
この圧倒的多数のウェブページ作成者は社会的に抹殺されたのでしょうか?
Re: (スコア:0, 参考になる)
韓国の一般市民のレベルまで
>日本人をチョッパリ(쪽발이)と呼び、天皇陛下を日王(일왕)と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。
ということは流石にないだろうけど、有名人ではそれに近い状況だな。
韓国のアーティストや俳優は、韓国国内でのライブ等では必ず反日ソングを歌ったりMCをしないとメディアからバッシングされ
ファンからも見放されるという現実がある。
有名どころでは、かつて日本でブームを起こしたペ・ヨンジュンも、公の場では日本に対して好意的な発言をしつつ、
韓国でのコンサートでは反日ソングを歌いまくっていた。そうしないと圧力で消されてしまうから。
また、韓国での日本に対するヘイトスピーチの酷さは、日本政府が国連総会等で積極的にアピールして対抗すべきレベル。
客観的・常識的な判断力を持ち合わせているなら、どちらの国にヘイトスピーチを正確に識別する人工知能が必要なのか一目瞭然。
Re: (スコア:0)
KじゃなくてCの国に向けて「私は父が米国人で、母が在日韓国人です。」と自分は日本人ではないと言い訳しながら謝罪したモデルがいたね。
反日ソング? (スコア:0)
反日ソングってなに?
「独島は我が領土」のことなら別に反日でもなんでもないと思うが。
返せ北方領土というキャンペーンに趣旨したからといって、
その人が反ソ、反ロとは限らないのといっしょ。
むしろ韓国人が竹島は日本人のものと言う方がおかしいのであって
自国の領土というキャンペーンソングを歌ったからと
反日とレッテルを貼るのは歪曲に等しい。
Re: (スコア:0)
右翼界隈では、自分たちに都合の悪いもの、自公政権に反対をするもの、
アメリカへの批判は反日らしいです。
アメリカ批判がなぜ反日なのかは理解できないですけども。
たとえば、米軍属に日本人女性が殺されたことに対して怒って抗議したら
反日左翼ということになるようですね。
意味わかんないですよね。
自分たちの主張を正当化して国民の支持を集めたいと考えたいときに、
ナショナリズムを煽っているだけかもしれません。
Re: (スコア:0)
指摘を受け入れ、表現を若干改めよう。
日本人をチョッパリ(쪽발이)と蔑称で呼んでも非難されず、天皇陛下を日王(일왕)と蔑称で呼ばないと社会的に抹消される国と、日本の現状は比ぶべくもない。
例えるなら、新聞TVを含め、半島人を「チョン」と呼んでも何ら非難されず、朴槿恵大統領を「女酋長」と呼ばないと社会的に抹消される状態という事。
実際朴槿恵大統領が、「日王」と呼ばず「天皇」と呼んで非難を浴びていたっけ。
「一番必要なのはどう見ても日本」など、彼我を比べて明らかな捏造。
連中は米Wikipediaや、「Yahoo! News」「Yahoo! Finance」の記事コメント等へも、同様な捏造・憎悪(=ヘイト)投稿を日常的・組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が喩え英文しか処理できなくても、充分有用な技術である。
Re: (スコア:0)
韓国の方がひどいから日本は許されると言いたい?
Re: (スコア:0)
私は差別主義者じゃないですが、技術的好奇心から、日本語化されたおりには
そのような遠回しなヘイトスピーチが判別できるのか試してみたいですね。
でも米Yahoo!は解体されちゃうのですよね。
ヘイトデマなんてのも判別できると、ネット情報の質向上につながるでしょうに。
Re: (スコア:0)
この親コメ程度の言い回しでヘイトスピーチになるのは、言論統制じゃないかな。
単なる悪口でしょ。
「日本○ね」「あべ○ね」のような直接的な言葉がヘイトスピーチになるのかも聞いてみたくは有ります。
Re: (スコア:0)
誰が読んでも酷いヘイトスピーチだというものもありますけど、
言い回しでヘイトスピーチと認定されないようにしたヘイトスピーチに関して
検知できるかっていう話なんですけど、あなたには難しすぎましたか?
#この程度はヘイトじゃなくて悪口なんですよね。
日本でもはよ (スコア:0)
日本は対策が遅れすぎですわ。
Re:日本でもはよ (スコア:2, すばらしい洞察)
日本での日本に対するヘイトが多すぎて、本来のヘイトを識別できないんでしょ
Re: (スコア:0)
○○のヘイトは良いヘイトとかがあるので無理だね。
「良いヘイト」でぐぐると
Re:日本でもはよ (スコア:1)
そう棄てたもんでもないです。例えば、最も文化的な先進地域であるところの京都なんかでは、
古くからヘイトスピーチ排除が強力に進められた結果と思しきフィルタに引っかからない表現が洗練されまくっています。
例
ぶぶ漬けいかがどす? → 帰れ
ほんに頭のええお人の考えはることは → アホちゃうか
Re:日本でもはよ (スコア:2)
いや、東京人にまで「田舎からよう出てきはりましたなぁ。」というのはフィルタか?
Re: (スコア:0)
東京なんて首都になってから百年そこそこなんだから京都から見れば田舎もいいとこ。
Re: (スコア:0)
公式には東京への遷都は宣言されていないので、そもそも首都ではない。と、京都の方はおっしゃいますな。
# そもそも首都を正式に定めていない国が結構多いので、「首都」という単語は、「事実上の首都」というような意味も含意していると見るべきかも
Re:日本でもはよ (スコア:2)
あくまでも「行幸中」。
長い。
Re:日本でもはよ (スコア:1)
不謹慎な発言をする。
行幸中ということは警備の手が足りないという口実で
閨に普段出入りしない女性が複数を招じ入れられたり
あるいは当人がお忍びで女のいる家に上がり込むことが
大目に見られるものだと思っているのに。。。
先々代が定めた一夫一婦制をガチガチに守りすぎ。
Re: (スコア:0)
天皇がいるところが首都だ、という定義は、なされているのでしょうか?
Re:日本でもはよ (スコア:2)
日本は遷都の御璽は天皇の住むところの宣言ではなかったと。福原遷都とか。
ところでオランダは首都がアムステルダムだけど、ベアトリクス前女王はハーグに住んでた。
ベルギーもブリュッセルじゃなくて、ワロン地方に住んでるんじゃなかったかと。
Re:日本でもはよ (スコア:2)
現在の皇室典範では庶子は皇位継承順位に入りませんから、何かあったら面倒くさくなります。
守った方が安全。
訓練を受けていない人 (スコア:0)
ヘイトスピーチで使われる隠語を知らない人間より、その手の隠語を登録している人工知能の方が検出率が高いって、当然じゃね?