アカウント名:
パスワード:
二人零和有限確定完全情報ゲームはもうどんな仕組みでも人間の負けは確定ですかね?この3日で使ったGCP換算コストも発表してほしい
乱戦になればなるほど、互角に近づく可能性は高いと思う。
なので、たとえば進める方向の組み合わせが増えるとか,コマを取った時の選択肢が増えるとか、コマの種類が増える、コマがスタックできてその順序が戦闘に影響するなどすれば、変わるかもしんない。
(必ずしも完全情報じゃないけど)「ギレンの野望」シリーズとかにも、けっこういろんな「定石」と呼ばれる物があったけど、ああいうのも演繹や帰納といった推論抜きの単純な総当たりの試行錯誤だけで作り出すのは難しいかもしれない。https://www14.atwiki.jp/imperatorgirenv/pages/134.html [atwiki.jp]
たとえば「Q:戦闘開始時の初期配置は?」「A:機体のID順に並べられてる(らしい)。」みたいな奴だと、仮に並んでる順序は決定的でも、それを思い通りに制御するのは激しく難しい。特定の機体を入れたり入れなかったりするだけで、ほぼシャッフルされちゃって、それがその後のゲーム進行をガラリと変えてしまうから。だからといって、それで人間有利になるかというと、それもまた不明なんだけどさ。
>特定の機体を入れたり入れなかったりするだけで、ほぼシャッフルされちゃって、それがその後の>ゲーム進行をガラリと変えてしまうから。機械オンリー学習の怖い所は、それすら幾らでも総当たりで実践学習できるって所だろ。
挙句、試行に人間であることに拠る時間ロスが無い。機械の速度からすると、思考どころか決めた一手を指すための時間ですら、長大な時間だ。分担して並列化ってのも幾らでも出来る。
それが均一的で等確率であればいいんだけどね。バラツキがある場合はその限りではない。仮にするとしても、あまりに効率が悪すぎる。#そういう意味においては、囲碁はコンピューターにとって「楽な」処理なのだ。
今は「特定のポイントでガラリとかわる」ということを認識できないし、「ここを重点的に学習すべきだ」という判断もできない。
そういうのを認識してヒューリスティックに処理する部分は、人間様に全部丸投げしてる。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
二人零和有限確定完全情報ゲーム (スコア:4, 興味深い)
二人零和有限確定完全情報ゲームはもうどんな仕組みでも人間の負けは確定ですかね?
この3日で使ったGCP換算コストも発表してほしい
Re:二人零和有限確定完全情報ゲーム (スコア:0)
乱戦になればなるほど、互角に近づく可能性は高いと思う。
なので、たとえば進める方向の組み合わせが増えるとか,コマを取った時の選択肢が増えるとか、
コマの種類が増える、コマがスタックできてその順序が戦闘に影響するなどすれば、変わるかもしんない。
(必ずしも完全情報じゃないけど)「ギレンの野望」シリーズとかにも、けっこういろんな
「定石」と呼ばれる物があったけど、ああいうのも演繹や帰納といった推論抜きの単純な総当たりの
試行錯誤だけで作り出すのは難しいかもしれない。
https://www14.atwiki.jp/imperatorgirenv/pages/134.html [atwiki.jp]
たとえば「Q:戦闘開始時の初期配置は?」「A:機体のID順に並べられてる(らしい)。」
みたいな奴だと、仮に並んでる順序は決定的でも、それを思い通りに制御するのは激しく難しい。
特定の機体を入れたり入れなかったりするだけで、ほぼシャッフルされちゃって、それがその後の
ゲーム進行をガラリと変えてしまうから。
だからといって、それで人間有利になるかというと、それもまた不明なんだけどさ。
Re:二人零和有限確定完全情報ゲーム (スコア:1)
>特定の機体を入れたり入れなかったりするだけで、ほぼシャッフルされちゃって、それがその後の
>ゲーム進行をガラリと変えてしまうから。
機械オンリー学習の怖い所は、それすら幾らでも総当たりで実践学習できるって所だろ。
Re: (スコア:0)
挙句、試行に人間であることに拠る時間ロスが無い。
機械の速度からすると、思考どころか決めた一手を指すための時間ですら、長大な時間だ。
分担して並列化ってのも幾らでも出来る。
Re: (スコア:0)
それが均一的で等確率であればいいんだけどね。バラツキがある場合はその限りではない。
仮にするとしても、あまりに効率が悪すぎる。
#そういう意味においては、囲碁はコンピューターにとって「楽な」処理なのだ。
今は「特定のポイントでガラリとかわる」ということを認識できないし、
「ここを重点的に学習すべきだ」という判断もできない。
そういうのを認識してヒューリスティックに処理する部分は、人間様に全部丸投げしてる。