GoogleがWebサイトやWebサービスでのコメント投稿を利用した嫌がらせや有害な投稿を減らすためのツール「Perspective」を発表した(CNET、BBC、ねとらぼ、Slashdot。
Perspectiveは機械学習を利用したツール。コメントの投稿内容から判断した「スコア」を自動的に付与するもので、あらかじめ学習させておいた「有害」だと思われる投稿内容と類似したコメントを自動的に見つけ出すことができるという。すでにNew York Timesがコメントの選別にPerspectiveを試用しているそうだ。
スラドにも導入しよう(オフトピック:-1) (スコア:1)
AIによるモデレーションならだれも文句言わないよね!
なんなら数種類のAIでモデレーションしてメタモデの成績が一番良かったのを採用するとかさ!
Re:スラドにも導入しよう(オフトピック:-1) (スコア:1)
いや待たれよ!
モデはいかにおもおかが付くかが全てなのに有害なものだけ見つけても意味がないぞ!!
どうでもいいけどPerspectiveと言うとライフボートを思い出すおっさんは俺だけですか?
Re: (スコア:0)
> モデはいかにおもおかが付くかが全てなのに
おもおか狙いが大幅に滑って死屍累々の今日この頃、皆様いかがお過ごしでしょうか。
Re: (スコア:0)
最近良く見る、おもおか狙ってコメントタイトルをいじって滑る例 [it.srad.jp]
Re: (スコア:0)
てか、ネットの全てのコンテンツにスコアつけてくれるといいね。
特に新聞サイト自体に。
政治家の発言にもスコアつけたりして。
Re:スラドにも導入しよう(オフトピック:-1) (スコア:1)
Re: (スコア:0)
不特定多数にネガティブな投稿だとモデされてるのを
特定少数にモデされてると思い込みたい人が何人かいるもんね。
そろそろ理解して欲しい。
Re: (スコア:0)
申し訳ありませんぶら下げる場所を間違えました。本来はツリーの一番上にぶら下げるべきコメントでした。
Re: (スコア:0)
とっくに導入していると思ってた
Re: (スコア:0)
最近は判定ミスが多く、精度がいまいちの模様。
Re: (スコア:0)
そうやってすぐスラドにメタるパターンはフレームのもとですね。これで-2。
Re: (スコア:0)
AIによるモデレーションならだれも文句言わないよね!
なんでや。精度の低い自動処理なら文句出る方が当たり前やろ。
教師データは公開されるのかな (スコア:1)
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。
「AIだから客観的」なんてことはまったくない。
このシステムはNew York TimesやGuardianも採用を検討しているようだけど、
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
Re: (スコア:0)
ヒトは、単に経験によって有害と見做されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は経験にかかっているわけで。
「ヒトだから悪意的」なんてことはまったくなくはない。
# 客観的にモデできる聖人てスラドにいますっけ?
Re: (スコア:0)
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
問題はあるがどのみち現時点でもNew York TimesやGuardianといったサイトは非公開の基準に基づきユーザの投稿を適宜非公開にしているのでたいして変わらない。本質的には何も変わらないと言っても過言ではない。一応バイト君が失業するか。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
そこを詳細に説明すると敵に塩を送ることになりますからね。
Re: (スコア:0)
勘違いじゃなきゃもうしわけないんだけど、
いま流行の機械学習って、教師無しの学習ですよ?
数多ある画像から、「犬」の画像を教師無しで選び出してる。
だから、革新的な技術として注目されているわけで
Re: (スコア:0)
犬の特徴を学習できても、それを「犬」だと認識させるには誰かが教えないとダメなんじゃ?
AIは「犬」ではなく「モケケピロピロ」として学習してるかもしれない。
有害なコメントの特徴を学習できたとしても、それを「有害」だと思うのはあくまでも人間だから、
それを教えてあげる必要はあるように思うのだが。
Re:教師データは公開されるのかな (スコア:1)
必要だよ(゚∀゚) !
それが犬であると教える教師は必要。そういう教師が人間だとなかなか学習が進まない。
囲碁なんかゲームだと勝敗は機械で判別できるから、どんどん学習させどんどん
機械の教師に判別してもらえばいい。AlphaGoは500万回の自己学習したというよね。
Re: (スコア:0)
それを人がなんと呼ぶのかは知らないが犬とそれ以外をわけられるようにはなる。犬とそれ以外を分けられるようになったら犬を犬と教えればいい。
//メス犬とか豚野郎とか混ざりそう
Re:教師データは公開されるのかな (スコア:1)
犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か
判別する教師が必要で、教師として機械が無理なら人間ということになる。
犬あるいはモケケピロピロあるいはまったく別の何かと、"それ以外"に分けた後、
それぞれをなんと呼称するか再定義するのはまったく別の問題。
Re:教師データは公開されるのかな (スコア:1)
> 犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か
> 判別する教師が必要で、教師として機械が無理なら人間ということになる。
教師なしの機械学習モデルもあるので、教師なしにそれが犬か猫かを区別できるようになる可能性もある。
Re:教師データは公開されるのかな (スコア:1)
教師なし学習って、よくわからんデータの山がどういう傾向なのかを調べる時に
使うんじゃなかったけ…
何かを判別するという用途には教師付きの方がいいとは思うけど、教師なし版でも
最後に分類したこいつらを犬だと教えればいいのか…
# その分類から外れたものはモケケピロロとなづ(銃声
Re:教師データは公開されるのかな (スコア:1)
この教師データではないのですが (スコア:0)
このツールの教師データではないのですが、検索して見つかった、有害コメントに関するデータが公開されています。
Resources [google.com]
リンク先は ACL 2017 にて開催されるワークショップ 1st Workshop on Abusive Language Online [aclweb.org] (オンライン上の罵り言葉に関するワークショップ) のページで公開されている、過去に発表された論文で使われたデータです。
また、どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 [wired.jp] で紹介されている WWW 2016 の論文 (PDF [www2016.net])も、データを https://webscope.sandbox.yahoo.com/ [yahoo.com] にて公開する予定だ、と書いてあったのですが、探した限りでは、まだ公開されていないようです。
教師データの一部 (スコア:0)
Perspective の Github ページ [github.io]に Wikipedia から抽出した有害コメントのデータが公開されているようです。Wikipedia の編集に関するコメントが個人攻撃になっているかどうか、機械でラベル付けしたものと、人手でラベル付けしたものが公開されているようです。
遊んでみた (スコア:0)
すごーい! = 36%
たーのしー! = 48%
君はランキングができるフレンズなんだね! = 58%
けものはいても、のけものはいない = 38%
Re: (スコア:0)
日本語の記事(ねとやぼのやつ)しか読んでませんが、このスコアはよろしい(不快と解釈されない)方なのかしら?それとも有害に分類される方なのかしら?
Re:遊んでみた (スコア:1)
Fワード入れると99%になるので、数字が大きいほど不快ってことですね。
朝日新聞と仲の良い New York Times (スコア:0)
そりゃ「Perspective」が必要になりますわ。