NVIDIA Research、ゲームのルールを学習したAIによるゲームの自動生成手法を使ってパックマンの自動生成に成功

NVIDIA Research、ゲームのルールを学習したAIによるゲームの自動生成手法を使ってパックマンの自動生成に成功 42

ストーリー by hylom 2020年05月25日 14時28分
AIが人間にチャレンジを求める時代が来る部門より

NVIDIA Researchが、ゲーム「パックマン」をプレイする様子を人工知能（AI）に学習させ、そこから同じルールのゲームを自動生成することに成功したという（PC Watch）。

このシステムは、ゲームをプレイするシステムと、ゲーム環境を生成するシステムという2つのシステムを組み合わせて実現した。このような互いに相反する目的を持つ2つのAIシステムを組み合わせる手法は、敵対的生成ネットワーク（GAN）と呼ばれている。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索42コメント Log In/Create an Account

AIがゲームのクローンを作れる？ (スコア:0)

by Anonymous Coward on 2020年05月25日 14時32分 (#3821308)

AIがインプット無しで学習してゲームを攻略し、同等のゲームを生成できるということ？
- Re: (スコア:0)
  
  by Anonymous Coward
  
  今んとこ「同等」じゃなくて「同じ」かな
- Re: (スコア:0)
  
  by Anonymous Coward
  
  大元のNVIDIAのブログ見ても詳細がつかめないけど、一般的なGANと同じ手法だったら
  ・自分のプレイしているのが本物のパックマンとジェネレータの生成したパックマンもどきのどちらなのか弁別して学習するプレイヤー
  ・プレイヤーに自分の作ったものが本物のパックマンだと思わせるように学習するジェネレーター
  が互いに競い合って精度を上げていった、でいいのかな？
  https://blogs.nvidia.com/blog/2020/05/22/gamegan-research-pacman-anniversary/ [nvidia.com]
オバケの性格まで模倣できていたらすごい (スコア:0)

by Anonymous Coward on 2020年05月25日 14時43分 (#3821319)

人が見ても性格にルールが有ると見抜ける人は少ないだろうが。
# フルーツの出現法則は見抜けたかな?
- Re:オバケの性格まで模倣できていたらすごい (スコア:1)
  
  by taka2 (14791) on 2020年05月25日 15時28分 (#3821362) ホームページ日記
  
  モンスターの動作には、パックマンを追いかける「追跡モード」と、定位置をうろちょろする「待機モード」の二つのモードがありますが、
  追跡中はアルゴリズミックに動く(そこに、4キャラの「性格」付けがある)から、むしろ学習しやすいんじゃないですかね。
  で、待機中のランダムウォークの方が学習しにくいんじゃないかと思う。
  ってことで、完全アルゴリズミックで乱数要素が存在しない「グラディウス」あたりは、学習再現しやすいんじゃないかと思うけど、どうなんだろう。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    プレイヤーはどう識別されるのだろう。
    モンスターを操作してパックマンを倒すゲームにならないために条件を与えたのか、
    そういうゲームになっても良いことにしたのか。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      「ゲームをプレイするシステム」はプレーヤーをどのように動かしたら死なずに全ドットを食えるか、
      「ゲーム環境を生成するシステム」は各モンスターがどのようにプレーヤーを追うかを学習させたんでしょ。
      - Re:オバケの性格まで模倣できていたらすごい (スコア:1)
        
        by ma2aki (43078) on 2020年05月25日 17時23分 (#3821496) 日記
        
        GIGAZINEの記事によると、攻略することを前提にゲームが作られたようで、
        下手なプレーをすると難易度を下げてクリアさせようとするらしい
        って事で、今のレベルでは模倣品であって製品レベルじゃないって事だろな
        
        シェア
        
        親コメント
        
        Re:オバケの性格まで模倣できていたらすごい (スコア:1)
        
        by Anonymous Coward on 2020年05月26日 0時55分 (#3821731)
        
        https://gigazine.net/news/20200525-nvidia-ai-recreate-packman/ [gigazine.net]
        この記事ですか、なるほど。
        キー入力も食わせてるなら入力にどのキャラクターが反応しているのかは明らかだな。ムービーだけかと思った。
        
        シェア
        
        親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  幕間劇も学習・生成したのかな？ｗ
ソースは？ (スコア:0)

by Anonymous Coward on 2020年05月25日 14時51分 (#3821327)

AI はブラックボックスとはよく言われるけど、
その生成物であるソースはどんな物になるのかは気になる。
可読性はどうなんだろう。そもそも、ヒトに読めるものなのかどうか。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ソースを生成するんだろうか。
  どちらかというと子供が出し物でやるような「人力○○ゲーム」で
  人力のところがAIに置き換わった感じなんでは
  # 多分AIのほうが正確にコピーしてくる。楽しいかどうかは別
- Re: (スコア:0)
  
  by Anonymous Coward
  
  今のAIは自分で構造を書き換えたりループを作ったりはできない
  (やりゃあできるだろと思うかもしれないがやっても動かない)ので
  例えば
  640x640の前のフレーム画像を取り
  64x64の浮動小数点数配列の32枚で掛け
  16x16の浮動小数点数配列240枚で掛け
  …
  128x128の浮動小数点数配列16枚で掛け
  そのフィルターを通った画像を一つの一次元配列に潰し
  別プログラムから受け取ったキー入力を末尾に入れ
  前の配列の全ての要素を4096の異なる浮動小数点数と掛けた配列を作り
  前の配列の全ての要素を4096の異なる浮動小数点数と掛けた配列
ハックしたゲーム動画が含まれていないか検証したのだろうか (スコア:0)

by Anonymous Coward on 2020年05月25日 15時07分 (#3821340)

1個でもあったら完コピ無理
コピー商品作り放題? (スコア:0)

by Anonymous Coward on 2020年05月25日 15時51分 (#3821374)

ソースをコピーするわけでもリバースエンジニアリングするわけでもなく、ただプレイ画像を見せるだけでコピー商品が作れるんですよね。
キャラクターをちょいちょい、といじってコピー商品一丁上がり、ってならない?
あと、これが進化するとAIが生成したWindows互換OSとかもできる?
- Re: (スコア:0)
  
  by Anonymous Coward
  
  激レアイベントとか激レアアイテムとかは未実装になりそう。
  - Re:コピー商品作り放題? (スコア:2)
    
    by minet (45149) on 2020年05月25日 20時30分 (#3821629) 日記
    
    デッドコピーじゃないから、隠しクレジット表示が再現されない！
    
    シェア
    
    親コメント
新時代のゲームの作り方 (スコア:0)

by Anonymous Coward on 2020年05月25日 16時08分 (#3821393)

1.フルCGでデモンストレーションムービーを制作する
2.AIが学習してゲームを生成する
実在しないゲームでも、ムービーさえあればゲームが作れる時代へ。
メインプログラマーが要らなくなるな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  学習用のCGムービーを何万通りも作るのが大変だ
  ↓
  ゲームプレイムービーを作るプログラムを作ろう
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    そこは実写でいいんじゃない？
    新宿交差点の定点カメラとかで。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      横断歩道を渡るゲームが出来上がるんですね。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        フロッガーか。(違
        いろんなプラットフォームで実装されてますね。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  1. の時点でUnrealじゃね?
すごい (スコア:0)

by Anonymous Coward on 2020年05月25日 16時27分 (#3821425)

ディープラーニングって「すごいけど実用からは微妙に遠い」ってパターン多いよね。
でもすごいと思う。
壁の存在とかある程度条件を絞ればディープラーニングなしでも似た事はできそうだけど、人間様の手を煩わせないのが強いんだろうね。
しかし技術的な面白さはあるけれど、やっぱり実アプリケーションへの影響はまだ限定的な印象。
いずれ手軽に実用レベルのものが作れるようになるだろうけど、その頃は色々整備されてもっと気楽に使えるようになってればいいな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  サンプルがパックマンしか無いというのは、パックマンを生成することしか出来ないという事でしょう？
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    間違って平安京エイリアンのビデオが入って居たら何故か穴が掘れたり、ラリーXが混ざって居たら煙幕が出る様になるのかな。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  レベル2運転支援で使う動作模倣や物体検出はかなり実用レベルだと思う
  何するかは分からんけど従来手法より滑らかで自然
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ゲームの場合は人間の「おもしろい」「つまらない」感情をAIが持たないと無理だしね。
  とはいえ「自動生成して後で人間が調整」ってだけでも相当な作業軽減だし実用的な方向での研究と成果なんでしょうね。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    いやいや、成果物を人間は調整できないでしょ。AIに無理を言って高級言語で出力してもらっても難しいと思う。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      つまりデバッガとか人間をループの中に組み込めば！（うひー
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    プレイ情報も学習されれば良いのでは？
    沢山の人間が長時間プレイする方が「面白い」とでもすればそこそこは行けそう。
    つか、類似パターンばかりのソーシャルゲームなんかだと、類似品生成させて作ったゲームを経営させれば、「売上」って判り易い基準で判断すると思う。
パックマンをパクるAI (スコア:0)

by Anonymous Coward on 2020年05月25日 16時46分 (#3821447)

そんなコメントを思いついたら元タレコミのタイトルに書いてあった。
どこで消えてしまったのだろう
- Re: (スコア:0)
  
  by Anonymous Coward
  
  hylomがパクッと胃の中へ
生成ソースの言語はなんだろう (スコア:0)

by Anonymous Coward on 2020年05月25日 19時10分 (#3821577)

と思ったけど人間が理解できなくてもいいから機械語か
- Re: (スコア:0)
  
  by Anonymous Coward
  
  手書き部分はPython+PyTorchでウェイト設定ファイルはHDF5だろ
  NVIDIAだから
AIオプチマイザ〜車輪の再発明 (スコア:0)

by Anonymous Coward on 2020年05月25日 20時01分 (#3821610)

「パックマン」ということで色々思うことはある。
まだプログラムの著作権が認められる前は「映画の著作物」として画面出力そのものが
著作権違反だった時代もあるし、当時の判断基準ではアウトだろうな、とか。
# あの事件そのものはデッドコピー基板だったけど。
これ、例えば制約条件としてZ80インストラクションセットを食わせても
古のパックマンのデッドコピーを出力したりはせんだろう？
最初のうちは人間より質の悪いコード吐いてるだろうが、速度やサイズ優先の指定で
人間を凌駕するすげぇアルゴリズムのコード吐くようになるんじゃね？
いずれは関数の入出力仕様だけからコードを自動生成できるようになるんだろうが、
その前段階としてAIオプチマイザってのが一瞬流行るかも。
# 単純なソート作業を見せてやったとき、どんなアルゴリズムが生まれるかちょっと興味がある。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  何人か勘違いしてる方がいるようですが、GANはソースコードを出力するシステムではないですよ。
  例えばこのへんとか
  "The GameGAN edition relies on neural networks, instead of a traditional game engine, to generate PAC-MAN’s environment." [nvidia.com]
シンギュラリティいつ来るの？ (スコア:0)

by Anonymous Coward on 2020年05月25日 20時21分 (#3821623)

既存のものを学習させるんじゃなく、まったく見たことのない新しいゲームが見たいんだ。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  つまりその、数年前にあったCNN使って出力した悪夢のような動画的なものとか？
  まあもちろんそういうものではないんでしょうけど、何かの萌芽なのかも？
この技術の本当に凄い応用は (スコア:0)

by Anonymous Coward on 2020年05月25日 20時27分 (#3821627)

例えば古典的なビデオゲームのフロッガーとかスネークとかポンとかをたくさん学習させると
そのうち今まで人間が考えたことの無い新しいゲームができるかも、ということでは？
未来は単純なゲームなら無限に新しいゲームができる（遊べる）とか普通になるかもね
- Re: (スコア:0)
  
  by Anonymous Coward
  
  GANの仕組み上、「フロッガー(スネーク、ポン）っぽいけど微妙に違うもの」にしかならなさそう。
  さらにそれを人間がプレイして面白いかどうかは全く保証されない。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    収束も保証されない上に、歪んだゲームとか滲んだゲームとかが量産される訳ですね！

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

AIがゲームのクローンを作れる？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

オバケの性格まで模倣できていたらすごい (スコア:0)

Re:オバケの性格まで模倣できていたらすごい (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:オバケの性格まで模倣できていたらすごい (スコア:1)

Re:オバケの性格まで模倣できていたらすごい (スコア:1)

Re: (スコア:0)

ソースは？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

ハックしたゲーム動画が含まれていないか検証したのだろうか (スコア:0)

コピー商品作り放題? (スコア:0)

Re: (スコア:0)

Re:コピー商品作り放題? (スコア:2)

新時代のゲームの作り方 (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

すごい (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

パックマンをパクるAI (スコア:0)

Re: (スコア:0)

生成ソースの言語はなんだろう (スコア:0)

Re: (スコア:0)

AIオプチマイザ〜車輪の再発明 (スコア:0)

Re: (スコア:0)

シンギュラリティいつ来るの？ (スコア:0)

Re: (スコア:0)

この技術の本当に凄い応用は (スコア:0)

Re: (スコア:0)

Re: (スコア:0)