アカウント名:
パスワード:
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。「AIだから客観的」なんてことはまったくない。
このシステムはNew York TimesやGuardianも採用を検討しているようだけど、教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
このツールの教師データではないのですが、検索して見つかった、有害コメントに関するデータが公開されています。
Resources [google.com]
リンク先は ACL 2017 にて開催されるワークショップ 1st Workshop on Abusive Language Online [aclweb.org] (オンライン上の罵り言葉に関するワークショップ) のページで公開されている、過去に発表された論文で使われたデータです。
また、どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 [wired.jp] で紹介されている WWW 2016 の論文 (PDF [www2016.net])も、データを https://webscope.sandbox.yahoo.com/ [yahoo.com] にて公開する予定だ、と書いてあったのですが、探した限りでは、まだ公開されていないようです。
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。
確かに機械に学習させるので、教師データに掛かっているのは、おっしゃる通りだと思います。それを踏まえて、この WWW 2016 の論文では、「キーワードにひっかからないように、時間とともにユーザが工夫する場合」などに対応しているようです。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
教師データは公開されるのかな (スコア:1)
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。
「AIだから客観的」なんてことはまったくない。
このシステムはNew York TimesやGuardianも採用を検討しているようだけど、
教師データが公開されないままに利用されるのは、言論の自由という観点からとても問題があると思う。
#しかし、いつもながらGoogleのサイトは技術情報に乏しくていらいらするな!
この教師データではないのですが (スコア:0)
このツールの教師データではないのですが、検索して見つかった、有害コメントに関するデータが公開されています。
Resources [google.com]
リンク先は ACL 2017 にて開催されるワークショップ 1st Workshop on Abusive Language Online [aclweb.org] (オンライン上の罵り言葉に関するワークショップ) のページで公開されている、過去に発表された論文で使われたデータです。
また、どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 [wired.jp] で紹介されている WWW 2016 の論文 (PDF [www2016.net])も、データを https://webscope.sandbox.yahoo.com/ [yahoo.com] にて公開する予定だ、と書いてあったのですが、探した限りでは、まだ公開されていないようです。
AIは、単に教師データによって有害と示されたコメントと類似したコメントを選んでいるだけに過ぎず、
なにを有害と見なすかの判断は、結局は教師データにかかっているわけで。
確かに機械に学習させるので、教師データに掛かっているのは、おっしゃる通りだと思います。それを踏まえて、この WWW 2016 の論文では、「キーワードにひっかからないように、時間とともにユーザが工夫する場合」などに対応しているようです。