アカウント名:
パスワード:
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。「AIだから客観的」なんてことはまったくない。
このシステムはNew York TimesやGuardianも採用を検討しているようだけど、教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
ヒトは、単に経験によって有害と見做されたコメントと類似したコメントを選んでいるだけに過ぎず、なにを有害と見なすかの判断は、結局は経験にかかっているわけで。「ヒトだから悪意的」なんてことはまったくなくはない。
# 客観的にモデできる聖人てスラドにいますっけ?
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
問題はあるがどのみち現時点でもNew York TimesやGuardianといったサイトは非公開の基準に基づきユーザの投稿を適宜非公開にしているのでたいして変わらない。本質的には何も変わらないと言っても過言ではない。一応バイト君が失業するか。
そこを詳細に説明すると敵に塩を送ることになりますからね。
勘違いじゃなきゃもうしわけないんだけど、いま流行の機械学習って、教師無しの学習ですよ?数多ある画像から、「犬」の画像を教師無しで選び出してる。だから、革新的な技術として注目されているわけで
犬の特徴を学習できても、それを「犬」だと認識させるには誰かが教えないとダメなんじゃ?AIは「犬」ではなく「モケケピロピロ」として学習してるかもしれない。
有害なコメントの特徴を学習できたとしても、それを「有害」だと思うのはあくまでも人間だから、それを教えてあげる必要はあるように思うのだが。
必要だよ(゚∀゚) !
それが犬であると教える教師は必要。そういう教師が人間だとなかなか学習が進まない。囲碁なんかゲームだと勝敗は機械で判別できるから、どんどん学習させどんどん機械の教師に判別してもらえばいい。AlphaGoは500万回の自己学習したというよね。
それを人がなんと呼ぶのかは知らないが犬とそれ以外をわけられるようにはなる。犬とそれ以外を分けられるようになったら犬を犬と教えればいい。//メス犬とか豚野郎とか混ざりそう
犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か判別する教師が必要で、教師として機械が無理なら人間ということになる。
犬あるいはモケケピロピロあるいはまったく別の何かと、"それ以外"に分けた後、それぞれをなんと呼称するか再定義するのはまったく別の問題。
> 犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か> 判別する教師が必要で、教師として機械が無理なら人間ということになる。
教師なしの機械学習モデルもあるので、教師なしにそれが犬か猫かを区別できるようになる可能性もある。
教師なし学習って、よくわからんデータの山がどういう傾向なのかを調べる時に使うんじゃなかったけ…
何かを判別するという用途には教師付きの方がいいとは思うけど、教師なし版でも最後に分類したこいつらを犬だと教えればいいのか…
# その分類から外れたものはモケケピロロとなづ(銃声
このツールの教師データではないのですが、検索して見つかった、有害コメントに関するデータが公開されています。
Resources [google.com]
リンク先は ACL 2017 にて開催されるワークショップ 1st Workshop on Abusive Language Online [aclweb.org] (オンライン上の罵り言葉に関するワークショップ) のページで公開されている、過去に発表された論文で使われたデータです。
また、どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 [wired.jp] で紹介されている WWW 2016 の論文 (PDF [www2016.net])も、データを https://webscope.sandbox.yahoo.com/ [yahoo.com] にて公開する予定だ、と書いてあったのですが、探した限りでは、まだ公開されていないようです。
Perspective の Github ページ [github.io]に Wikipedia から抽出した有害コメントのデータが公開されているようです。Wikipedia の編集に関するコメントが個人攻撃になっているかどうか、機械でラベル付けしたものと、人手でラベル付けしたものが公開されているようです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
教師データは公開されるのかな (スコア:1)
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。
「AIだから客観的」なんてことはまったくない。
このシステムはNew York TimesやGuardianも採用を検討しているようだけど、
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
Re: (スコア:0)
ヒトは、単に経験によって有害と見做されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は経験にかかっているわけで。
「ヒトだから悪意的」なんてことはまったくなくはない。
# 客観的にモデできる聖人てスラドにいますっけ?
Re: (スコア:0)
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
問題はあるがどのみち現時点でもNew York TimesやGuardianといったサイトは非公開の基準に基づきユーザの投稿を適宜非公開にしているのでたいして変わらない。本質的には何も変わらないと言っても過言ではない。一応バイト君が失業するか。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
そこを詳細に説明すると敵に塩を送ることになりますからね。
Re: (スコア:0)
勘違いじゃなきゃもうしわけないんだけど、
いま流行の機械学習って、教師無しの学習ですよ?
数多ある画像から、「犬」の画像を教師無しで選び出してる。
だから、革新的な技術として注目されているわけで
Re: (スコア:0)
犬の特徴を学習できても、それを「犬」だと認識させるには誰かが教えないとダメなんじゃ?
AIは「犬」ではなく「モケケピロピロ」として学習してるかもしれない。
有害なコメントの特徴を学習できたとしても、それを「有害」だと思うのはあくまでも人間だから、
それを教えてあげる必要はあるように思うのだが。
Re:教師データは公開されるのかな (スコア:1)
必要だよ(゚∀゚) !
それが犬であると教える教師は必要。そういう教師が人間だとなかなか学習が進まない。
囲碁なんかゲームだと勝敗は機械で判別できるから、どんどん学習させどんどん
機械の教師に判別してもらえばいい。AlphaGoは500万回の自己学習したというよね。
Re: (スコア:0)
それを人がなんと呼ぶのかは知らないが犬とそれ以外をわけられるようにはなる。犬とそれ以外を分けられるようになったら犬を犬と教えればいい。
//メス犬とか豚野郎とか混ざりそう
Re:教師データは公開されるのかな (スコア:1)
犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か
判別する教師が必要で、教師として機械が無理なら人間ということになる。
犬あるいはモケケピロピロあるいはまったく別の何かと、"それ以外"に分けた後、
それぞれをなんと呼称するか再定義するのはまったく別の問題。
Re:教師データは公開されるのかな (スコア:1)
> 犬とそれ以外を分けるためにも、それが犬(あるいはモケケピロピロと呼んでも良い)か否か
> 判別する教師が必要で、教師として機械が無理なら人間ということになる。
教師なしの機械学習モデルもあるので、教師なしにそれが犬か猫かを区別できるようになる可能性もある。
Re:教師データは公開されるのかな (スコア:1)
教師なし学習って、よくわからんデータの山がどういう傾向なのかを調べる時に
使うんじゃなかったけ…
何かを判別するという用途には教師付きの方がいいとは思うけど、教師なし版でも
最後に分類したこいつらを犬だと教えればいいのか…
# その分類から外れたものはモケケピロロとなづ(銃声
Re:教師データは公開されるのかな (スコア:1)
この教師データではないのですが (スコア:0)
このツールの教師データではないのですが、検索して見つかった、有害コメントに関するデータが公開されています。
Resources [google.com]
リンク先は ACL 2017 にて開催されるワークショップ 1st Workshop on Abusive Language Online [aclweb.org] (オンライン上の罵り言葉に関するワークショップ) のページで公開されている、過去に発表された論文で使われたデータです。
また、どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 [wired.jp] で紹介されている WWW 2016 の論文 (PDF [www2016.net])も、データを https://webscope.sandbox.yahoo.com/ [yahoo.com] にて公開する予定だ、と書いてあったのですが、探した限りでは、まだ公開されていないようです。
教師データの一部 (スコア:0)
Perspective の Github ページ [github.io]に Wikipedia から抽出した有害コメントのデータが公開されているようです。Wikipedia の編集に関するコメントが個人攻撃になっているかどうか、機械でラベル付けしたものと、人手でラベル付けしたものが公開されているようです。