アカウント名:
パスワード:
基本モンテカルロで、詰めの部分がディープラーニングって感じなのかな?
できればモンテカルロ法なしで勝って欲しい。
モンテカルロ法なしでモンテカルロ法と同等の性能,モンテカルロ法もあわせて使うとさらに強くなったらしいです.http://www.nature.com/nature/journal/v529/n7587/abs/nature16961_ja.htm... [nature.com]# あわせて使った手法が何かは聞かないで
Value network は置く場所の評価だろうけど policy network ってなんだろう?使用する定石の評価なのかな?
value networkがその局面でどちらが優勢かの評価で、policy networkがどの手を深くよむかの評価(のはず)
valueが勝てる手を決める。policyが相手が打つ場所の確率らしい。
やっぱり全手完全解析しないとダメですね。
モンテカルロ法は途中経過がデタラメでもそこそこの強さですが、悪手を廃して良手だけを読むようにすればより強くなることが知られています。その良手をピックアップするのに機械学習によるパターン認識を使ったのかと思われます。なお、そのパターン認識だけで先読みをしなくても、モンテカルロ法並みの強さが有るらしい。
DLにしろ、パラメータ学習にすぎないのでいまいち面白味に欠けますね学習したパラメータから囲碁の構造(数学みたいな)を得ることをできれば、非常にエキサイティングです
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー
モンテカルロとディープラーニングの組み合わせ? (スコア:0)
基本モンテカルロで、詰めの部分がディープラーニングって感じなのかな?
Re: (スコア:0)
できればモンテカルロ法なしで勝って欲しい。
Re:モンテカルロとディープラーニングの組み合わせ? (スコア:1)
モンテカルロ法なしでモンテカルロ法と同等の性能,モンテカルロ法もあわせて使うとさらに強くなったらしいです.
http://www.nature.com/nature/journal/v529/n7587/abs/nature16961_ja.htm... [nature.com]
# あわせて使った手法が何かは聞かないで
Re: (スコア:0)
Value network は置く場所の評価だろうけど policy network ってなんだろう?
使用する定石の評価なのかな?
Re: (スコア:0)
value networkがその局面でどちらが優勢かの評価で、policy networkがどの手を深くよむかの評価(のはず)
Re: (スコア:0)
valueが勝てる手を決める。policyが相手が打つ場所の確率らしい。
Re: (スコア:0)
やっぱり全手完全解析しないとダメですね。
Re: (スコア:0)
モンテカルロ法は途中経過がデタラメでもそこそこの強さですが、
悪手を廃して良手だけを読むようにすればより強くなることが知られています。
その良手をピックアップするのに機械学習によるパターン認識を使ったのかと思われます。
なお、そのパターン認識だけで先読みをしなくても、モンテカルロ法並みの強さが有るらしい。
Re: (スコア:0)
DLにしろ、パラメータ学習にすぎないのでいまいち面白味に欠けますね
学習したパラメータから囲碁の構造(数学みたいな)を得ることをできれば、非常にエキサイティングです