パスワードを忘れた? アカウント作成
12865081 story
Yahoo!

米Yahoo!、ヘイトスピーチを正確に検出できるシステムを開発 77

ストーリー by hylom
ほこたて 部門より

今年3月、Microsoftの人工知能「Tay」が人種差別的な発言(ヘイトスピーチ)を話すよう学習させられてしまったことが話題になったが(過去記事)、今度は米Yahoo!がコメント内のヘイトスピーチを正確に識別する人工知能を開発したそうだ(WIRED論文PDF)。

単に特定のキーワードを検出するだけでなく、文脈から判断して人種差別的な発言を検出できるのが特徴。人工知能の学習には、Yahoo! NewsやYahoo! Financeのコメントとして投稿されたテキストを使用したという。この人工知能は「訓練を受けていない人」よりも高精度でコメントを判断できることも実験で明らかにされているとのこと。このデータベースはYahoo!のWebscopeという研究者向けサイトで公開されるようだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Takahiro_Chou (21972) on 2016年08月04日 10時55分 (#3057880) 日記

    政治家・有名人が問題発言→
    擁護意見「発言の一部を切り取るのでは無く、全文を読め」→
    当該AIに全文を入力したら「完全にアウト」の結果が

    • by Anonymous Coward

      こういう話 [netgeek.biz]を見ると、「完全にアウト」なのはマスコミだよねぇ

      #このAIで「切り取られ、報道された発言」と「オリジナルの全文」をチェックして、ヘイトスピーチの度合いにどれくらい差が付くか、なんて調べたら面白そうだ

      • いや、それこそ、全文だと逆にアチャーなパターンでしょう……。
        丸山氏の言ってる事には、事実誤認が有って、オバマ大統領は、「アフリカ系」だけど「奴隷の子孫」では無いんですよ。(ケニアからの留学生と白人系のアメリカ人の間に生まれた子供)
        だからこそ、「オバマは本当はアメリカ国籍を持ってない」「オバマは本当はイスラム教徒」みたいなデマを言う奴が居たり、予備選の時に、アフリカ系の人から「本当に貴方は、私達の仲間なの??」みたいな質問をされた訳で……。

        親コメント
  • by nemui4 (20313) on 2016年08月04日 7時22分 (#3057768) 日記

    候補者と応援者たちのスピーチやコメントをこれに突っ込んだら面白そう。

    日本語はダメなんだろうけど都知事選のも突っ込んでたら色々引っかかってたりして。

    • by Anonymous Coward

      There's not a black America and white America and Latino America and Asian America
      後略

  • by Ykr (46986) on 2016年08月04日 8時15分 (#3057785) 日記

    「ネオナチは見つけだして叩き潰せ」
    「共産主義者は見つけだして叩き潰せ」
    「白人警官は見つけだして叩き潰せ」
    「移民推進派は見つけだして叩き潰せ」
    「移民は見つけだして叩き潰せ」
    「●●●政権支持者は見つけだして叩き潰せ」
    「きのこ派は見つけだして叩き潰せ」

    これらのパラグラフは、ヘイトスピーチかどうかの判定で同じスコアが出るのかなぁ、っていう疑問。

  • by Anonymous Coward on 2016年08月04日 6時24分 (#3057764)

    米Yahoo!って韓国で営業してたっけ?(喩え英文に限るにせよ)

    • 日本語のサンプルとして、このツリーを提供しよう。

      親コメント
      • by Anonymous Coward on 2016年08月04日 8時40分 (#3057791)

        例文がないとわかりにくいんだよね

        https://ja.wikipedia.org/wiki/%E3%83%98%E3%82%A4%E3%83%88%E3%82%B9%E3%... [wikipedia.org]

        ヘイトスピーチ(英: hate speech)とは人種、出身国、宗教、性的指向、性別、障害などに基づいて個人または集団を攻撃、脅迫、侮辱する発言や言動のことである。

        リア充(集団)爆発しろ(脅迫)!
        ホモ(性的指向)が嫌いな女子(性別)なんかいません(偏見)!
        お前の母ちゃん(個人)でべそ(侮辱)!
        ハゲ(障害)は恋愛対象外(排除)。
        うどん県(出身国)うどん(宗教)食いすぎ(侮辱)。

        親コメント
      • by Anonymous Coward

        本当にひどいことになってるな。こいつら本当に日本人?

    • by Anonymous Coward

      日本にもね
      根拠の希薄な人格攻撃でストレス発散してるだけの現状はあまりにも酷い

      • by Anonymous Coward on 2016年08月04日 7時33分 (#3057772)

        ネトウヨ連呼厨に対するヘイトはそこまでだ

        親コメント
      • by Anonymous Coward

        左翼が特にひどいよね。

        • by Anonymous Coward on 2016年08月04日 10時30分 (#3057865)

          そうでもないんじゃない?
          彼等はどちらかというとスピーチよりも暴力が得意だし。

          親コメント
        • by Anonymous Coward

          左翼よりも俗にいうサヨクとかパヨクがひどいよね。

        • by Anonymous Coward

          なんか、こういうコメントにプラスが付くのっていつもの不当モデレートなのか、
          それともヘイトスピーチの良い例としてプラスモデレートなのか判断が難しいな。

    • by Anonymous Coward

      お約束のブーメランをありがとう。一番必要なのはどう見ても日本です。

      • Re: (スコア:0, すばらしい洞察)

        by Anonymous Coward

        日本人をチョッパリ(쪽발이)と呼び、天皇陛下を日王(일왕)と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。
        例えるなら、新聞TVを含め、半島人を「チョン」と呼ばないと、社会的に抹消される状態という事。
        「一番必要なのはどう見ても日本」など、明らかな捏造。

        連中は米Wikipediaや、「Yahoo! News」や「Yahoo! Finance」の記事コメント等へも、同様な捏造投稿を組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が英文しか処理できなくても、充分有用な技術である。

        • by Anonymous Coward

          Google検索 日本人(일본인)13,500,000件 [google.co.jp]

          Google検索 チョッパリ(쪽발이)170,000件 [google.co.jp]

          ウェブ上からは韓国語の「日本人」という表現は駆逐されていないどころか圧倒的多数のようですが。
          この圧倒的多数のウェブページ作成者は社会的に抹殺されたのでしょうか?

          • Re: (スコア:0, 参考になる)

            by Anonymous Coward

            韓国の一般市民のレベルまで

            >日本人をチョッパリ(쪽발이)と呼び、天皇陛下を日王(일왕)と蔑称で呼ばないと、社会的に抹消される国と日本の現状は比ぶべくもない。

            ということは流石にないだろうけど、有名人ではそれに近い状況だな。
            韓国のアーティストや俳優は、韓国国内でのライブ等では必ず反日ソングを歌ったりMCをしないとメディアからバッシングされ
            ファンからも見放されるという現実がある。
            有名どころでは、かつて日本でブームを起こしたペ・ヨンジュンも、公の場では日本に対して好意的な発言をしつつ、
            韓国でのコンサートでは反日ソングを歌いまくっていた。そうしないと圧力で消されてしまうから。
            また、韓国での日本に対するヘイトスピーチの酷さは、日本政府が国連総会等で積極的にアピールして対抗すべきレベル。
            客観的・常識的な判断力を持ち合わせているなら、どちらの国にヘイトスピーチを正確に識別する人工知能が必要なのか一目瞭然。

            • by Anonymous Coward

              KじゃなくてCの国に向けて「私は父が米国人で、母が在日韓国人です。」と自分は日本人ではないと言い訳しながら謝罪したモデルがいたね。

            • by Anonymous Coward

              反日ソングってなに?

              「独島は我が領土」のことなら別に反日でもなんでもないと思うが。

              返せ北方領土というキャンペーンに趣旨したからといって、
              その人が反ソ、反ロとは限らないのといっしょ。

              むしろ韓国人が竹島は日本人のものと言う方がおかしいのであって
              自国の領土というキャンペーンソングを歌ったからと
              反日とレッテルを貼るのは歪曲に等しい。

              • by Anonymous Coward

                右翼界隈では、自分たちに都合の悪いもの、自公政権に反対をするもの、
                アメリカへの批判は反日らしいです。

                アメリカ批判がなぜ反日なのかは理解できないですけども。
                たとえば、米軍属に日本人女性が殺されたことに対して怒って抗議したら
                反日左翼ということになるようですね。
                意味わかんないですよね。

                自分たちの主張を正当化して国民の支持を集めたいと考えたいときに、
                ナショナリズムを煽っているだけかもしれません。

          • by Anonymous Coward

            指摘を受け入れ、表現を若干改めよう。

            日本人をチョッパリ(쪽발이)と蔑称で呼んでも非難されず、天皇陛下を日王(일왕)と蔑称で呼ばないと社会的に抹消される国と、日本の現状は比ぶべくもない。
            例えるなら、新聞TVを含め、半島人を「チョン」と呼んでも何ら非難されず、朴槿恵大統領を「女酋長」と呼ばないと社会的に抹消される状態という事。
            実際朴槿恵大統領が、「日王」と呼ばず「天皇」と呼んで非難を浴びていたっけ。
            「一番必要なのはどう見ても日本」など、彼我を比べて明らかな捏造。

            連中は米Wikipediaや、「Yahoo! News」「Yahoo! Finance」の記事コメント等へも、同様な捏造・憎悪(=ヘイト)投稿を日常的・組織的に行っているから、米Yahoo!の「罵り検知アルゴリズム」が喩え英文しか処理できなくても、充分有用な技術である。

        • by Anonymous Coward

          韓国の方がひどいから日本は許されると言いたい?

    • by Anonymous Coward

      私は差別主義者じゃないですが、技術的好奇心から、日本語化されたおりには
      そのような遠回しなヘイトスピーチが判別できるのか試してみたいですね。

      でも米Yahoo!は解体されちゃうのですよね。

      ヘイトデマなんてのも判別できると、ネット情報の質向上につながるでしょうに。

      • by Anonymous Coward

        この親コメ程度の言い回しでヘイトスピーチになるのは、言論統制じゃないかな。
        単なる悪口でしょ。

        「日本○ね」「あべ○ね」のような直接的な言葉がヘイトスピーチになるのかも聞いてみたくは有ります。

        • by Anonymous Coward

          誰が読んでも酷いヘイトスピーチだというものもありますけど、
          言い回しでヘイトスピーチと認定されないようにしたヘイトスピーチに関して
          検知できるかっていう話なんですけど、あなたには難しすぎましたか?

          #この程度はヘイトじゃなくて悪口なんですよね。

  • by Anonymous Coward on 2016年08月04日 8時40分 (#3057790)

    日本は対策が遅れすぎですわ。

    • Re:日本でもはよ (スコア:2, すばらしい洞察)

      by Anonymous Coward on 2016年08月04日 9時48分 (#3057832)

      日本での日本に対するヘイトが多すぎて、本来のヘイトを識別できないんでしょ

      親コメント
      • by Anonymous Coward

        ○○のヘイトは良いヘイトとかがあるので無理だね。
        「良いヘイト」でぐぐると

        良いヘイトに関連する検索キーワード
        韓国のヘイトスピーチはいいのか

    • by Anonymous Coward on 2016年08月04日 11時15分 (#3057889)

      そう棄てたもんでもないです。例えば、最も文化的な先進地域であるところの京都なんかでは、
      古くからヘイトスピーチ排除が強力に進められた結果と思しきフィルタに引っかからない表現が洗練されまくっています。


      ぶぶ漬けいかがどす? → 帰れ
      ほんに頭のええお人の考えはることは → アホちゃうか

      親コメント
      • by manmos (29892) on 2016年08月04日 11時40分 (#3057900) 日記

        いや、東京人にまで「田舎からよう出てきはりましたなぁ。」というのはフィルタか?

        親コメント
        • by Anonymous Coward

          東京なんて首都になってから百年そこそこなんだから京都から見れば田舎もいいとこ。

          • by Anonymous Coward

            公式には東京への遷都は宣言されていないので、そもそも首都ではない。と、京都の方はおっしゃいますな。

            # そもそも首都を正式に定めていない国が結構多いので、「首都」という単語は、「事実上の首都」というような意味も含意していると見るべきかも

            • by manmos (29892) on 2016年08月04日 12時47分 (#3057945) 日記

              あくまでも「行幸中」。
              長い。

              親コメント
              • by shibuya (17159) on 2016年08月04日 13時17分 (#3057967) 日記

                不謹慎な発言をする。

                行幸中ということは警備の手が足りないという口実で
                閨に普段出入りしない女性が複数を招じ入れられたり
                あるいは当人がお忍びで女のいる家に上がり込むことが
                大目に見られるものだと思っているのに。。。

                先々代が定めた一夫一婦制をガチガチに守りすぎ。

                親コメント
              • by Anonymous Coward

                天皇がいるところが首都だ、という定義は、なされているのでしょうか?

              • by manmos (29892) on 2016年08月04日 13時34分 (#3057977) 日記

                日本は遷都の御璽は天皇の住むところの宣言ではなかったと。福原遷都とか。

                ところでオランダは首都がアムステルダムだけど、ベアトリクス前女王はハーグに住んでた。
                ベルギーもブリュッセルじゃなくて、ワロン地方に住んでるんじゃなかったかと。

                親コメント
              • by manmos (29892) on 2016年08月04日 13時42分 (#3057983) 日記

                現在の皇室典範では庶子は皇位継承順位に入りませんから、何かあったら面倒くさくなります。
                守った方が安全。

                親コメント
  • by Anonymous Coward on 2016年08月04日 12時37分 (#3057934)

    ヘイトスピーチで使われる隠語を知らない人間より、その手の隠語を登録している人工知能の方が検出率が高いって、当然じゃね?

typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...