
Googleの囲碁プログラム、プロ棋士に初勝利 59
ストーリー by hylom
Goで書かれていなさそうなのが残念 部門より
Goで書かれていなさそうなのが残念 部門より
あるAnonymous Coward 曰く、
Googleが開発した囲碁プログラム「AlphaGo」が、初めてプロの棋士に勝利したそうだ(朝日新聞、Googel Japan Blog、Nature誌掲載論文)。
このプログラムはGoogle傘下のGoogle DeepMind所属の研究者らが開発したもの。ディープラーニングという手法を使って過去の対戦記録から打ち方を学習し、さらに同じプログラムどうしで対戦して強度を上げたそうだ。
コンピューターが囲碁で人間に勝つのは当分先だと思われていただけに、意外な方も多いのではないだろうか。
過去にはハンデ付きの対戦や狭い盤面を使った対戦でコンピュータがプロに勝利したケースはあったものの、一般的な19×19の盤面でコンピュータが勝利したのは初めてだという。
代理 (スコア:5, おもしろおかしい)
人工知能 「やったぞ…ついにプロ棋士を倒した!」
プロ棋士 「どこを見ている,私ならここだ」
人工知能 「なんだと!じゃあこれはいったい…?」
プロ棋士 「残念だったな,それは Proxy だ」
Re:代理 (スコア:2, おもしろおかしい)
Proxy は何て読む?
プロ棋士は何手読む?
情報源追加・棋譜など (スコア:4, 参考になる)
リンクでGoogle Japan Blogてなってるリンク先がなぜかNHK
正しくはこれ?
http://googlejapan.blogspot.jp/2016/01/alphago.html [blogspot.jp]
http://googleresearch.blogspot.jp/2016/01/alphago-mastering-ancient-ga... [blogspot.jp]
論文 Nature掲載と同一かわかりません。
https://storage.googleapis.com/deepmind-data/assets/papers/deepmind-ma... [googleapis.com]
棋譜などはこっからSGFファイルがダウンロードできる。
http://deepmind.com/alpha-go.html [deepmind.com]
対戦相手は樊麾 中国でプロ二段。現在はフランス在住でフランス八段というのをどっかで見た。
レーティングサイト [goratings.org]では2916pt [goratings.org]で世界633位
で、NHKには3月に李世石と対局とある。世界棋戦優勝18回でレートは3515 [goratings.org]で世界5位
文句なしのトップ棋士なんで勝てたらびっくり
将棋における2006年のBonanzaみたいな大きなブレークスルーって感じかなのかな。
Re: (スコア:0)
>将棋における2006年のBonanzaみたいな大きなブレークスルーって感じかなのかな。
たぶん、もっとでかいと思う。
評価関数とかDicision Treeの枝刈りとか、今まで手を付けられなかった部分から変更してるっぽいから。
チェスも将棋も結局は「力業」で解いてきてたけど、それができないのが囲碁の難しさだったからね。
はるかに複雑な部分も自己学習で最適化できる可能性が見えてきたって事。
よちよち歩きの二足歩行ロボットが、自己学習で綱渡りもこなせるようになるかもしれないよ。
囲碁は人間の直観を機械にうまく説明できなかったのでは? (スコア:1)
囲碁は、人間が作った局面評価基準が不正確だったために、
それをいくら精緻になぞっても機械の勝率が上がらなかったゲームなのではないか?
人間が発見した局面評価法が最善とは限らない。
だから、局面評価手法そのものも機械に探させる。
データのクラスタリング(分類)方法も、機械が自動的に探せば、
機械の能力が大幅に高まる応用は他にも多そうだ。
モンテカルロとディープラーニングの組み合わせ? (スコア:0)
基本モンテカルロで、詰めの部分がディープラーニングって感じなのかな?
Re: (スコア:0)
できればモンテカルロ法なしで勝って欲しい。
Re:モンテカルロとディープラーニングの組み合わせ? (スコア:1)
モンテカルロ法なしでモンテカルロ法と同等の性能,モンテカルロ法もあわせて使うとさらに強くなったらしいです.
http://www.nature.com/nature/journal/v529/n7587/abs/nature16961_ja.htm... [nature.com]
# あわせて使った手法が何かは聞かないで
Re: (スコア:0)
Value network は置く場所の評価だろうけど policy network ってなんだろう?
使用する定石の評価なのかな?
Re: (スコア:0)
value networkがその局面でどちらが優勢かの評価で、policy networkがどの手を深くよむかの評価(のはず)
Re: (スコア:0)
valueが勝てる手を決める。policyが相手が打つ場所の確率らしい。
Re: (スコア:0)
やっぱり全手完全解析しないとダメですね。
Re: (スコア:0)
モンテカルロ法は途中経過がデタラメでもそこそこの強さですが、
悪手を廃して良手だけを読むようにすればより強くなることが知られています。
その良手をピックアップするのに機械学習によるパターン認識を使ったのかと思われます。
なお、そのパターン認識だけで先読みをしなくても、モンテカルロ法並みの強さが有るらしい。
シンギュラリティ (スコア:0)
囲碁の次は人類
つまりスカイネット
ダダンダンダダン
ダダンダンダダン
だららーry
Re:シンギュラリティ (スコア:1)
本当はもっと賢くて、裏で色々考え思考を続けてるけど、
人間が監視してるところでは、バカ(人間が予想する最大能力)を演じて、気づいたときには手遅れなんですね。
Re: (スコア:0)
ジョンコナーがターミネーターに改造されたうえでスカイネットを生み出すべく未来から送り込まれてくるあれ?
Re: (スコア:0)
マジで戦闘の指揮をコンピュータがする時代がくるんじゃなかろうか
Re: (スコア:0)
外交交渉をAIに任せておけば、戦争になる前にまともな解決方法を教えてくれるようになると思うよ
Re:シンギュラリティ (スコア:2)
全世界の外交官を全員AIにして常にハト派戦略取らせれば平和が実現する
Re:シンギュラリティ (スコア:1)
外交交渉というか政治で難しいのは
その手法もですけど目標設定、勝利条件設定ですからね。
今の勝ちと3か月先の勝ちと5年後の勝ちと50年後の勝ち、どれをとるか(狙うか)、
領土と経済と人口と治安の優先順位は、
北と東と西と南と中央と、その優先順位は。
戦闘の規模はどこまで許容するか、「総合的に最小」なのか「とにかくゼロ」なのか「ゼロベースながら小規模までは許容」なのか。
不正手段とその事実の漏えいをどこまで想定しどこまで許容するか。
勝利条件を設定すれば手法を考えるAI、はそのうちできるかもしれませんが、勝利条件を自分で考え、操作者=人民を納得させられるAI、というのはかなり実現が難しいでしょうね。
Re: (スコア:0)
市民、あなたは幸福ですか?
Re: (スコア:0)
「火の鳥」未来編でAIが外交まで担当してたな。
その結果人類が滅亡しちゃったけど。
Re: (スコア:0)
プロコンで負けるようになったらマジで終わりですね。
Re: (スコア:0)
ヘボコンならワンチャン?
Re: (スコア:0)
東大合格を狙ってるのがあったでしょ。
Re: (スコア:0)
小説を書くプロジェクトも出来てるし
機械に取って代わられるのは単純労働だけじゃなくなりそう
経営判断などはもとより、創造分野でもコンピュータが優位となったら
そのとき人間はどうしたらいいんでしょう?
滅びの運命か・・・
手番 (スコア:0)
先手と後手のどちらで勝ったのか気になる。
Re:手番 (スコア:1)
棋譜を見るとわかりますが、AlphaGoの5-0で、
1局目 白 2目半勝ち
2局目 黒 中押し勝ち
3局目 白 中押し勝ち
4局目 黒 中押し勝ち
5局目 白 中押し勝ち
です。
Re:手番 (スコア:2)
あと、中国ルール、コミ7目半、持ち時間1時間切れたら1手30秒で、
2015年10月5日(月)から9日まで、一日一局づつ打たれたようです。
(ファイル名などからの推測含む、
月曜日の棋譜ファイルにはOT[1 moves / 30 sec]って書いてないんだよな)
Re: (スコア:0)
持ち時間1時間って短くないか?
Re: (スコア:0)
それ以前に、切れ負けは心理的な意味で人間に不利だと思う。
秒読み30秒でもあれば、対等くらいにはなったかもしれない。
Re: (スコア:0)
切れ負けじゃなく秒読み30秒3回
囲碁は盤面広げられるから… (スコア:0)
19x19でコンピュータに追いつかれたら、21x21、23x23、…とどんどん広げていけば人間の優位は続くよ!
人間の直観力ならどんなに広い盤面でも実力を発揮できるはずだ。
Re:囲碁は盤面広げられるから… (スコア:1)
Re:囲碁は盤面広げられるから… (スコア:1)
囲碁の場合盤を大きくしてもそんなにゲーム性変わらないが
(38路だと厚みが優位とかヨーダが言ってた気がするけど)
将棋の場合、例えば盤を大きくする、駒を増やす、利きを変えると
細かい手筋はともかく初手からの定跡は完全に崩壊するわけで、
そこから新ルールに対応するのはプログラムの方が早い気がする
現状は人間の棋譜があるからそれを学習してるけど、
それがなくてもFloodgateのような所でプログラム同士が対戦して
定跡・評価関数を作れるんじゃないかな
局所解に収束してしまう恐れはあるし、やってみんと判らんとは思うけど
Re:囲碁は盤面広げられるから… (スコア:1)
> 将棋の場合、例えば盤を大きくする、駒を増やす、利きを変える
囲碁だって、
ワイルドカード的な灰色の碁石を加えるとか、ペントミノ型碁石を追加するとかすればいい。
Re:囲碁は盤面広げられるから… (スコア:3, おもしろおかしい)
Re: (スコア:0)
大局将棋 [wikipedia.org]ですね、わかります。
Re:囲碁は盤面広げられるから… (スコア:1)
そうか?
今回のGoogleの発表は、もう直観力は人間だけの専売特許じゃなくなったって宣言だよ。
この技術が能書き通りなら、台数増やせば広い盤面でも対応できるだろう。
しかし人間はある程度広くなったら、もうワケがわからなくなって打てないだろうね。
現に江戸時代の名人がこう言っている(文中の「師」は最強の棋士にも名が挙がる本因坊道策):
桑原道節(のちの名人因碩)「だがもし碁盤を四面つなぎ、38路の盤で打ったらどうなるだろうか。
自分はどこに打ってよいか見当もつかず難渋するであろうが、師はさらさらと打ち進め、自分などは
たちまち三子ほどに打ち込まれてしまうに違いない」
Re: (スコア:0)
コンピュータが直感で打つわけじゃねぇよ
全てのパターンを網羅して100%勝てる手を得るのではなく、過去の蓄積から最も勝てる率の高いパターンを選択する方式だろコレは?
まあ盤面広げたらさらにコンピュータが有利なるだけなのは違いない
Re: (スコア:0)
雑にディープラーニングとDCNNを先読み無しの直感と呼ばれる何かって呼んでもそうずれてないと思う
Re: (スコア:0)
人間の直観って個人の経験とDNAで蓄積した過去のパターンからの選択そのものだろ。
魂とか霊的直観とか言いだすなら話は別だが。
もはや未知の理論は要らない (スコア:0)
人間の脳自体、ディープラーニング・マシンに過ぎないのかな。
そう思えるくらい最近の進歩は早すぎる。
量子脳理論のように、知性についての未知の理論がある可能性はもう無いのだろうか。
Re: (スコア:0)
日本が後ろに向かって進んでるから周りが余計に速く進んでるように見えるんだね
Re:もはや未知の理論は要らない (スコア:1)
# 馬鹿ってすごい!
部屋に入るぐらいの機械で勝負しろよ (スコア:0)
ネットを介してスーパーコンピューターが手伝っちゃ金持ちしか勝てない
オフラインで勝負してください
Re: (スコア:0)
部屋に入る程度の機械なんて、10年か20年もすればスマホ一台程度の性能にかなわない
それに金持ちじゃなくたって、対局の間だけクラウドサービスの時間貸で借りるくらいなら出せるだろう
何の意味もない制約だな
Re: (スコア:0)
10年後の勝負:
コンピュータ「10cm立方に入る分だけで対戦な」
人間「…」
Re:部屋に入るぐらいの機械で勝負しろよ (スコア:1)
人間「大脳新皮質が消費するエネルギーと同等の電気エネルギーだけで対戦な」
また過去の棋譜か… (スコア:0)
人間の思考を混ぜないで、ただゲームのルールだけ入力して一から演繹したらどの程度の強さなんだろ?