米Yahoo!、ヘイトスピーチを正確に検出できるシステムを開発

米Yahoo!、ヘイトスピーチを正確に検出できるシステムを開発 77

ストーリー by hylom 2016年08月04日 6時00分
ほこたて部門より

今年3月、Microsoftの人工知能「Tay」が人種差別的な発言（ヘイトスピーチ）を話すよう学習させられてしまったことが話題になったが（過去記事）、今度は米Yahoo!がコメント内のヘイトスピーチを正確に識別する人工知能を開発したそうだ（WIRED、論文PDF）。

単に特定のキーワードを検出するだけでなく、文脈から判断して人種差別的な発言を検出できるのが特徴。人工知能の学習には、Yahoo! NewsやYahoo! Financeのコメントとして投稿されたテキストを使用したという。この人工知能は「訓練を受けていない人」よりも高精度でコメントを判断できることも実験で明らかにされているとのこと。このデータベースはYahoo!のWebscopeという研究者向けサイトで公開されるようだ。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索77コメント Log In/Create an Account

予想される未来 (スコア:2)

by Takahiro_Chou (21972) on 2016年08月04日 10時55分 (#3057880) 日記

政治家・有名人が問題発言→
擁護意見「発言の一部を切り取るのでは無く、全文を読め」→
当該AIに全文を入力したら「完全にアウト」の結果が
- Re: (スコア:0)
  
  by Anonymous Coward
  
  こういう話 [netgeek.biz]を見ると、「完全にアウト」なのはマスコミだよねぇ
  #このAIで「切り取られ、報道された発言」と「オリジナルの全文」をチェックして、ヘイトスピーチの度合いにどれくらい差が付くか、なんて調べたら面白そうだ
  - Re:予想される未来 (スコア:2)
    
    by Takahiro_Chou (21972) on 2016年08月04日 13時20分 (#3057969) 日記
    
    いや、それこそ、全文だと逆にアチャーなパターンでしょう……。
    丸山氏の言ってる事には、事実誤認が有って、オバマ大統領は、「アフリカ系」だけど「奴隷の子孫」では無いんですよ。(ケニアからの留学生と白人系のアメリカ人の間に生まれた子供)
    だからこそ、「オバマは本当はアメリカ国籍を持ってない」「オバマは本当はイスラム教徒」みたいなデマを言う奴が居たり、予備選の時に、アフリカ系の人から「本当に貴方は、私達の仲間なの??」みたいな質問をされた訳で……。
    
    シェア
    
    親コメント
    - - Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月04日 21時55分 (#3058256) 日記
        
        いや、だから、多分、人工知能に丸山氏の発言がヘイトスピーチか否かを判定させた場合、どっちの結果が出ようと、人工知能が何故、そう判断したかは、おそらく事実上判んない訳ですよね。
        困った事に、今のところ、「何故、丸山氏の発言がヘイトスピーチか否か」を判定して、その理由を言語化出来るのは、人間だけ。
        
        シェア
        
        親コメント
        
        Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月05日 1時43分 (#3058330) 日記
        
        それをマスコミが中途半端に短縮して世間一般でヘイトスピーチとされやすいであろう表現に改変したことは別の問題だし
        
        いや、ガチで全文やると、丸山氏がやらかした、アチャーな事実誤認まで解説しないといけない以上、一部だけ切り取って済ますのも「武士の情け」って解釈も有り得ますよね。
        私がマスコミ関係者だったら、丸山氏の事実誤認を微に入り細を穿って解説しますよ。全文を掲載した上でね。
        と云うか、丸山氏の、この発言、当時は「日本がアメリカの51番目の州になる」も問題視された記憶が有るのですが、何故、そこはガン無視されるのですか??
        貴方のマスコミ批判が妥当なら、そのマスコミと同じく、「一部だけ切り取り」「都合の悪い所はガン無視」をやってる、貴方は、一体、何をやりたいのですか??
        さらに言うなら、丸山氏の例の発言は、与党内からも批判が有り、丸山氏も謝罪し、自民党も丸山氏を厳重注意処分にして、国会の議事録からも削除されましたよね??
        だとしたら、与野党の少なからぬ議員のみならず、謝罪した丸山氏本人もマスコミの「虚報」を信じた訳ですか??
        人工知能ったってブラックボックスじゃ無くて所詮はプログラムが過去に蓄積されたデータをもとに判定している筈なので
        
        そう、何がヘイトスピーチかは、人間社会の都合で決まる事。そして、世の中に予想外の大きな変化が無い限り、「何がヘイトスピーチか」の規準は、厳しくなる事は有れ、緩くなる事は考えにくい。それらを考慮すれば、「丸山氏の例の発言を、人工知能がヘイトスピーチと判定するか？」と云う設問自体が無意味。
        どんな答を出すのであれ、人工知能の内部の規準・データ・アルゴリズムetcが更新されないので有れば『ヘイトスピーチか否かを判定する人工知能』としては役に立たない。
        それは、丸山氏の例の発言がヘイトスピーチであるかを、人間が判定する場合も同じ事。
        「丸山氏の例の発言がヘイトスピーチか??」に「正解」が有ったとしても、今日の「正解」が、5年後,10年後の「正解」とは限らない。
        
        シェア
        
        親コメント
        
        Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月05日 11時01分 (#3058472) 日記
        
        今回の主題は「ヘイトスピーチの抑止」であって「事実誤認かどうか」は別の問題なんだけど
        
        でも、ヘイトスピーチの大半は事実誤認に基いてますよね。
        「粗探し」と「ヘイトスピーチ」の区別も付かないバカはマスコミにはなれるかもしれないけど、マトモに支持は得られないだろうね。
        
        でも、当の丸山氏&自民党が、結局謝罪し、丸山氏は厳重注意処分ですよね。
        貴方はマスコミが全面的に悪かったと言いたいらしいけど、「マスコミの被害者」の筈の丸山氏&自民党が「私が悪うございました」「ウチの丸山が阿呆な事を言いまして」と認めちゃってる。
        どう云う事ですか、それ??
        強要その他が考えにくい状況で、当人&その所属政党が非を認めている以上、丸山氏の発言は「一部を切り取ったマスコミの虚報」の例としては、あんまり筋の良いモノじゃないと思いますよ。他に適切な事例は多々有るので、それを提示し直しては、どうでしょうか??
        
        シェア
        
        親コメント
        
        Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月05日 21時42分 (#3058870) 日記
        
        丸山氏に落ち度があることが、氏の発言内容がヘイトスピーチだという直接的な根拠にはならないし、ましてやマスコミが恣意的に切り取っていい理由にはならない。
        
        はぁ。
        「切り取ったのは、マスコミの『武士の情け』である可能性も有るのでは??」と言ってる私に対して、そんな事を言っても反論になってないですよ。
        私は「マスコミが恣意的に丸山氏の発言を切り取った事は、丸山氏に対してマイナスになったとは限らない」と考えてるけど、貴方は、そう考えてはいないようだ。
        一致していない前提を一方的にまくし立てても、私に対して、「お前が前提にしてる事は間違ってる」って言ってる事にはならない。
        
        シェア
        
        親コメント
    - - Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月05日 8時46分 (#3058387) 日記
        
        うん、だから、父親はケニア出身で、いわゆる「奴隷の子孫」なのは白人系の母親で、しかも明らかになったのは、大統領になって以降。
        
        シェア
        
        親コメント
        
        Re:予想される未来 (スコア:2)
        
        by Takahiro_Chou (21972) on 2016年08月05日 8時50分 (#3058390) 日記
        
        なので、示してもらったリンク先の内容は、やっぱり丸山氏の事実誤認を証明するモノですよ。
        丸山氏の認識：奴隷の子孫なのに大統領になれた
        事実：奴隷の子孫と思われてなかった人が大統領になって、大統領になった後に調べたら、父方/母方の内、まさか「奴隷の子孫」だとは誰も思ってなかった方が、たまたま、「奴隷の子孫」だった
        
        シェア
        
        親コメント
大統領選 (スコア:1)

by nemui4 (20313) on 2016年08月04日 7時22分 (#3057768) 日記

候補者と応援者たちのスピーチやコメントをこれに突っ込んだら面白そう。
日本語はダメなんだろうけど都知事選のも突っ込んでたら色々引っかかってたりして。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  There's not a black America and white America and Latino America and Asian America
  後略
主語による閾値 (スコア:1)

by Ykr (46986) on 2016年08月04日 8時15分 (#3057785) 日記

「ネオナチは見つけだして叩き潰せ」
「共産主義者は見つけだして叩き潰せ」
「白人警官は見つけだして叩き潰せ」
「移民推進派は見つけだして叩き潰せ」
「移民は見つけだして叩き潰せ」
「●●●政権支持者は見つけだして叩き潰せ」
「きのこ派は見つけだして叩き潰せ」
これらのパラグラフは、ヘイトスピーチかどうかの判定で同じスコアが出るのかなぁ、っていう疑問。
- Re:主語による閾値 (スコア:2)
  
  by Takahiro_Chou (21972) on 2016年08月04日 10時59分 (#3057882) 日記
  
  どう云う結果が出ても、「その人工知能が、そんなスコアを付けた原因は??」を解明するのは困難な気がします
  
  シェア
  
  親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  「汚物は消毒だ!」が前後の文脈で判定可能なら凄いですけど、どうなのでしょう。
今それが一番必要な国 (スコア:0)

by Anonymous Coward on 2016年08月04日 6時24分 (#3057764)

米Yahoo!って韓国で営業してたっけ？（喩え英文に限るにせよ）
- Re:今それが一番必要な国 (スコア:2)
  
  by hahahash (41409) on 2016年08月04日 8時09分 (#3057781) 日記
  
  日本語のサンプルとして、このツリーを提供しよう。
  
  シェア
  
  親コメント
  - Re:今それが一番必要な国 (スコア:1)
    
    by Anonymous Coward on 2016年08月04日 8時40分 (#3057791)
    
    例文がないとわかりにくいんだよね
    https://ja.wikipedia.org/wiki/%E3%83%98%E3%82%A4%E3%83%88%E3%82%B9%E3%... [wikipedia.org]
    ヘイトスピーチ（英: hate speech）とは人種、出身国、宗教、性的指向、性別、障害などに基づいて個人または集団を攻撃、脅迫、侮辱する発言や言動のことである。
    リア充（集団）爆発しろ（脅迫）！
    ホモ（性的指向）が嫌いな女子（性別）なんかいません（偏見）！
    お前の母ちゃん（個人）でべそ（侮辱）！
    ハゲ（障害）は恋愛対象外（排除）。
    うどん県（出身国）うどん（宗教）食いすぎ（侮辱）。
    
    シェア
    
    親コメント
    - Re:今それが一番必要な国 (スコア:2)
      
      by manmos (29892) on 2016年08月04日 11時37分 (#3057899) 日記
      
      > うどん県（出身国）うどん（宗教）食いすぎ（侮辱）。
      最近、政府が大阪人を侮辱しました。「米と粉モン一緒に食うな」と。
      ＃お好み焼きはキャベツ料理なのでセーフ。
      
      シェア
      
      親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    本当にひどいことになってるな。こいつら本当に日本人？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  日本にもね
  根拠の希薄な人格攻撃でストレス発散してるだけの現状はあまりにも酷い
  - Re:今それが一番必要な国 (スコア:1)
    
    by Anonymous Coward on 2016年08月04日 7時33分 (#3057772)
    
    ネトウヨ連呼厨に対するヘイトはそこまでだ
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    左翼が特にひどいよね。
    - Re:今それが一番必要な国 (スコア:1)
      
      by Anonymous Coward on 2016年08月04日 10時30分 (#3057865)
      
      そうでもないんじゃない？
      彼等はどちらかというとスピーチよりも暴力が得意だし。
      
      シェア
      
      親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      左翼よりも俗にいうサヨクとかパヨクがひどいよね。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      なんか、こういうコメントにプラスが付くのっていつもの不当モデレートなのか、
      それともヘイトスピーチの良い例としてプラスモデレートなのか判断が難しいな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  お約束のブーメランをありがとう。一番必要なのはどう見ても日本です。
  - Re: (スコア:0, すばらしい洞察)
    
    by Anonymous Coward
    
    日本人をチョッパリ（쪽발이）と呼び、天皇陛下を日王（일왕）と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。
    例えるなら、新聞TVを含め、半島人を「チョン」と呼ばないと、社会的に抹消される状態という事。
    「一番必要なのはどう見ても日本」など、明らかな捏造。
    連中は米Wikipediaや、「Yahoo! News」や「Yahoo! Finance」の記事コメント等へも、同様な捏造投稿を組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が英文しか処理できなくても、充分有用な技術である。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      Google検索日本人（일본인）13,500,000件 [google.co.jp]
      Google検索チョッパリ（쪽발이）170,000件 [google.co.jp]
      ウェブ上からは韓国語の「日本人」という表現は駆逐されていないどころか圧倒的多数のようですが。
      この圧倒的多数のウェブページ作成者は社会的に抹殺されたのでしょうか？
      - Re: (スコア:0, 参考になる)
        
        by Anonymous Coward
        
        韓国の一般市民のレベルまで
        >日本人をチョッパリ（쪽발이）と呼び、天皇陛下を日王（일왕）と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。
        ということは流石にないだろうけど、有名人ではそれに近い状況だな。
        韓国のアーティストや俳優は、韓国国内でのライブ等では必ず反日ソングを歌ったりMCをしないとメディアからバッシングされ
        ファンからも見放されるという現実がある。
        有名どころでは、かつて日本でブームを起こしたペ・ヨンジュンも、公の場では日本に対して好意的な発言をしつつ、
        韓国でのコンサートでは反日ソングを歌いまくっていた。そうしないと圧力で消されてしまうから。
        また、韓国での日本に対するヘイトスピーチの酷さは、日本政府が国連総会等で積極的にアピールして対抗すべきレベル。
        客観的・常識的な判断力を持ち合わせているなら、どちらの国にヘイトスピーチを正確に識別する人工知能が必要なのか一目瞭然。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        KじゃなくてCの国に向けて「私は父が米国人で、母が在日韓国人です。」と自分は日本人ではないと言い訳しながら謝罪したモデルがいたね。
        
        反日ソング？ (スコア:0)
        
        by Anonymous Coward
        
        反日ソングってなに？
        「独島は我が領土」のことなら別に反日でもなんでもないと思うが。
        返せ北方領土というキャンペーンに趣旨したからといって、
        その人が反ソ、反ロとは限らないのといっしょ。
        むしろ韓国人が竹島は日本人のものと言う方がおかしいのであって
        自国の領土というキャンペーンソングを歌ったからと
        反日とレッテルを貼るのは歪曲に等しい。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        右翼界隈では、自分たちに都合の悪いもの、自公政権に反対をするもの、
        アメリカへの批判は反日らしいです。
        アメリカ批判がなぜ反日なのかは理解できないですけども。
        たとえば、米軍属に日本人女性が殺されたことに対して怒って抗議したら
        反日左翼ということになるようですね。
        意味わかんないですよね。
        自分たちの主張を正当化して国民の支持を集めたいと考えたいときに、
        ナショナリズムを煽っているだけかもしれません。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        指摘を受け入れ、表現を若干改めよう。
        日本人をチョッパリ（쪽발이）と蔑称で呼んでも非難されず、天皇陛下を日王（일왕）と蔑称で呼ばないと社会的に抹消される国と、日本の現状は比ぶべくもない。
        例えるなら、新聞TVを含め、半島人を「チョン」と呼んでも何ら非難されず、朴槿恵大統領を「女酋長」と呼ばないと社会的に抹消される状態という事。
        実際朴槿恵大統領が、「日王」と呼ばず「天皇」と呼んで非難を浴びていたっけ。
        「一番必要なのはどう見ても日本」など、彼我を比べて明らかな捏造。
        連中は米Wikipediaや、「Yahoo! News」「Yahoo! Finance」の記事コメント等へも、同様な捏造・憎悪（＝ヘイト）投稿を日常的・組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が喩え英文しか処理できなくても、充分有用な技術である。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      韓国の方がひどいから日本は許されると言いたい？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  私は差別主義者じゃないですが、技術的好奇心から、日本語化されたおりには
  そのような遠回しなヘイトスピーチが判別できるのか試してみたいですね。
  でも米Yahoo!は解体されちゃうのですよね。
  ヘイトデマなんてのも判別できると、ネット情報の質向上につながるでしょうに。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    この親コメ程度の言い回しでヘイトスピーチになるのは、言論統制じゃないかな。
    単なる悪口でしょ。
    「日本○ね」「あべ○ね」のような直接的な言葉がヘイトスピーチになるのかも聞いてみたくは有ります。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      誰が読んでも酷いヘイトスピーチだというものもありますけど、
      言い回しでヘイトスピーチと認定されないようにしたヘイトスピーチに関して
      検知できるかっていう話なんですけど、あなたには難しすぎましたか？
      ＃この程度はヘイトじゃなくて悪口なんですよね。
日本でもはよ (スコア:0)

by Anonymous Coward on 2016年08月04日 8時40分 (#3057790)

日本は対策が遅れすぎですわ。
- Re:日本でもはよ (スコア:2, すばらしい洞察)
  
  by Anonymous Coward on 2016年08月04日 9時48分 (#3057832)
  
  日本での日本に対するヘイトが多すぎて、本来のヘイトを識別できないんでしょ
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ○○のヘイトは良いヘイトとかがあるので無理だね。
    「良いヘイト」でぐぐると
    良いヘイトに関連する検索キーワード
    韓国のヘイトスピーチはいいのか
- Re:日本でもはよ (スコア:1)
  
  by Anonymous Coward on 2016年08月04日 11時15分 (#3057889)
  
  そう棄てたもんでもないです。例えば、最も文化的な先進地域であるところの京都なんかでは、
  古くからヘイトスピーチ排除が強力に進められた結果と思しきフィルタに引っかからない表現が洗練されまくっています。
  例
  ぶぶ漬けいかがどす? → 帰れ
  ほんに頭のええお人の考えはることは → アホちゃうか
  
  シェア
  
  親コメント
  - Re:日本でもはよ (スコア:2)
    
    by manmos (29892) on 2016年08月04日 11時40分 (#3057900) 日記
    
    いや、東京人にまで「田舎からよう出てきはりましたなぁ。」というのはフィルタか？
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      東京なんて首都になってから百年そこそこなんだから京都から見れば田舎もいいとこ。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        公式には東京への遷都は宣言されていないので、そもそも首都ではない。と、京都の方はおっしゃいますな。
        # そもそも首都を正式に定めていない国が結構多いので、「首都」という単語は、「事実上の首都」というような意味も含意していると見るべきかも
        
        Re:日本でもはよ (スコア:2)
        
        by manmos (29892) on 2016年08月04日 12時47分 (#3057945) 日記
        
        あくまでも「行幸中」。
        長い。
        
        シェア
        
        親コメント
        
        Re:日本でもはよ (スコア:1)
        
        by shibuya (17159) on 2016年08月04日 13時17分 (#3057967) 日記
        
        不謹慎な発言をする。
        行幸中ということは警備の手が足りないという口実で
        閨に普段出入りしない女性が複数を招じ入れられたり
        あるいは当人がお忍びで女のいる家に上がり込むことが
        大目に見られるものだと思っているのに。。。
        先々代が定めた一夫一婦制をガチガチに守りすぎ。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        天皇がいるところが首都だ、という定義は、なされているのでしょうか？
        
        Re:日本でもはよ (スコア:2)
        
        by manmos (29892) on 2016年08月04日 13時34分 (#3057977) 日記
        
        日本は遷都の御璽は天皇の住むところの宣言ではなかったと。福原遷都とか。
        ところでオランダは首都がアムステルダムだけど、ベアトリクス前女王はハーグに住んでた。
        ベルギーもブリュッセルじゃなくて、ワロン地方に住んでるんじゃなかったかと。
        
        シェア
        
        親コメント
        
        Re:日本でもはよ (スコア:2)
        
        by manmos (29892) on 2016年08月04日 13時42分 (#3057983) 日記
        
        現在の皇室典範では庶子は皇位継承順位に入りませんから、何かあったら面倒くさくなります。
        守った方が安全。
        
        シェア
        
        親コメント
訓練を受けていない人 (スコア:0)

by Anonymous Coward on 2016年08月04日 12時37分 (#3057934)

ヘイトスピーチで使われる隠語を知らない人間より、その手の隠語を登録している人工知能の方が検出率が高いって、当然じゃね？

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

予想される未来 (スコア:2)

Re: (スコア:0)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

Re:予想される未来 (スコア:2)

大統領選 (スコア:1)

Re: (スコア:0)

主語による閾値 (スコア:1)

Re:主語による閾値 (スコア:2)

Re: (スコア:0)

今それが一番必要な国 (スコア:0)

Re:今それが一番必要な国 (スコア:2)

Re:今それが一番必要な国 (スコア:1)

Re:今それが一番必要な国 (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re:今それが一番必要な国 (スコア:1)

Re: (スコア:0)

Re:今それが一番必要な国 (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0, すばらしい洞察)

Re: (スコア:0)

Re: (スコア:0, 参考になる)

Re: (スコア:0)

反日ソング？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

日本でもはよ (スコア:0)

Re:日本でもはよ (スコア:2, すばらしい洞察)

Re: (スコア:0)

Re:日本でもはよ (スコア:1)

Re:日本でもはよ (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re:日本でもはよ (スコア:2)

Re:日本でもはよ (スコア:1)

Re: (スコア:0)

Re:日本でもはよ (スコア:2)

Re:日本でもはよ (スコア:2)

訓練を受けていない人 (スコア:0)