パスワードを忘れた? アカウント作成
14193839 story
ゲーム

NVIDIA Research、ゲームのルールを学習したAIによるゲームの自動生成手法を使ってパックマンの自動生成に成功 42

ストーリー by hylom
AIが人間にチャレンジを求める時代が来る 部門より

NVIDIA Researchが、ゲーム「パックマン」をプレイする様子を人工知能(AI)に学習させ、そこから同じルールのゲームを自動生成することに成功したという(PC Watch)。

このシステムは、ゲームをプレイするシステムと、ゲーム環境を生成するシステムという2つのシステムを組み合わせて実現した。このような互いに相反する目的を持つ2つのAIシステムを組み合わせる手法は、敵対的生成ネットワーク(GAN)と呼ばれている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2020年05月25日 14時32分 (#3821308)

    AIがインプット無しで学習してゲームを攻略し、同等のゲームを生成できるということ?

    • by Anonymous Coward

      今んとこ「同等」じゃなくて「同じ」かな

    • by Anonymous Coward

      大元のNVIDIAのブログ見ても詳細がつかめないけど、一般的なGANと同じ手法だったら
      ・自分のプレイしているのが本物のパックマンとジェネレータの生成したパックマンもどきのどちらなのか弁別して学習するプレイヤー
      ・プレイヤーに自分の作ったものが本物のパックマンだと思わせるように学習するジェネレーター
      が互いに競い合って精度を上げていった、でいいのかな?

      https://blogs.nvidia.com/blog/2020/05/22/gamegan-research-pacman-anniversary/ [nvidia.com]

  • by Anonymous Coward on 2020年05月25日 14時43分 (#3821319)

    人が見ても性格にルールが有ると見抜ける人は少ないだろうが。
    # フルーツの出現法則は見抜けたかな?

    • モンスターの動作には、パックマンを追いかける「追跡モード」と、定位置をうろちょろする「待機モード」の二つのモードがありますが、
      追跡中はアルゴリズミックに動く(そこに、4キャラの「性格」付けがある)から、むしろ学習しやすいんじゃないですかね。
      で、待機中のランダムウォークの方が学習しにくいんじゃないかと思う。

      ってことで、完全アルゴリズミックで乱数要素が存在しない「グラディウス」あたりは、学習再現しやすいんじゃないかと思うけど、どうなんだろう。

      親コメント
      • by Anonymous Coward

        プレイヤーはどう識別されるのだろう。

        モンスターを操作してパックマンを倒すゲームにならないために条件を与えたのか、
        そういうゲームになっても良いことにしたのか。

    • by Anonymous Coward

      幕間劇も学習・生成したのかな?w

  • by Anonymous Coward on 2020年05月25日 14時51分 (#3821327)

    AI はブラックボックスとはよく言われるけど、
    その生成物であるソースはどんな物になるのかは気になる。

    可読性はどうなんだろう。そもそも、ヒトに読めるものなのかどうか。

    • by Anonymous Coward

      ソースを生成するんだろうか。
      どちらかというと子供が出し物でやるような「人力○○ゲーム」で
      人力のところがAIに置き換わった感じなんでは

      # 多分AIのほうが正確にコピーしてくる。楽しいかどうかは別

    • by Anonymous Coward

      今のAIは自分で構造を書き換えたりループを作ったりはできない
      (やりゃあできるだろと思うかもしれないがやっても動かない)ので

      例えば
      640x640の前のフレーム画像を取り
      64x64の浮動小数点数配列の32枚で掛け
      16x16の浮動小数点数配列240枚で掛け

      128x128の浮動小数点数配列16枚で掛け
      そのフィルターを通った画像を一つの一次元配列に潰し
      別プログラムから受け取ったキー入力を末尾に入れ
      前の配列の全ての要素を4096の異なる浮動小数点数と掛けた配列を作り
      前の配列の全ての要素を4096の異なる浮動小数点数と掛けた配列

  • 1個でもあったら完コピ無理

  • by Anonymous Coward on 2020年05月25日 15時51分 (#3821374)

    ソースをコピーするわけでもリバースエンジニアリングするわけでもなく、ただプレイ画像を見せるだけでコピー商品が作れるんですよね。
    キャラクターをちょいちょい、といじってコピー商品一丁上がり、ってならない?

    あと、これが進化するとAIが生成したWindows互換OSとかもできる?

  • by Anonymous Coward on 2020年05月25日 16時08分 (#3821393)

    1.フルCGでデモンストレーションムービーを制作する

    2.AIが学習してゲームを生成する

    実在しないゲームでも、ムービーさえあればゲームが作れる時代へ。
    メインプログラマーが要らなくなるな。

    • by Anonymous Coward

      学習用のCGムービーを何万通りも作るのが大変だ

      ゲームプレイムービーを作るプログラムを作ろう

      • by Anonymous Coward

        そこは実写でいいんじゃない?
        新宿交差点の定点カメラとかで。

        • by Anonymous Coward

          横断歩道を渡るゲームが出来上がるんですね。

          • by Anonymous Coward

            フロッガーか。(違
            いろんなプラットフォームで実装されてますね。

    • by Anonymous Coward

      1. の時点でUnrealじゃね?

  • by Anonymous Coward on 2020年05月25日 16時27分 (#3821425)

    ディープラーニングって「すごいけど実用からは微妙に遠い」ってパターン多いよね。
    でもすごいと思う。
    壁の存在とかある程度条件を絞ればディープラーニングなしでも似た事はできそうだけど、人間様の手を煩わせないのが強いんだろうね。

    しかし技術的な面白さはあるけれど、やっぱり実アプリケーションへの影響はまだ限定的な印象。
    いずれ手軽に実用レベルのものが作れるようになるだろうけど、その頃は色々整備されてもっと気楽に使えるようになってればいいな。

    • by Anonymous Coward

      サンプルがパックマンしか無いというのは、パックマンを生成することしか出来ないという事でしょう?

      • by Anonymous Coward

        間違って平安京エイリアンのビデオが入って居たら何故か穴が掘れたり、ラリーXが混ざって居たら煙幕が出る様になるのかな。

    • by Anonymous Coward

      レベル2運転支援で使う動作模倣や物体検出はかなり実用レベルだと思う
      何するかは分からんけど従来手法より滑らかで自然

    • by Anonymous Coward

      ゲームの場合は人間の「おもしろい」「つまらない」感情をAIが持たないと無理だしね。
      とはいえ「自動生成して後で人間が調整」ってだけでも相当な作業軽減だし実用的な方向での研究と成果なんでしょうね。

      • by Anonymous Coward

        いやいや、成果物を人間は調整できないでしょ。AIに無理を言って高級言語で出力してもらっても難しいと思う。

        • by Anonymous Coward

          つまりデバッガとか人間をループの中に組み込めば!(うひー

      • by Anonymous Coward

        プレイ情報も学習されれば良いのでは?
        沢山の人間が長時間プレイする方が「面白い」とでもすればそこそこは行けそう。

        つか、類似パターンばかりのソーシャルゲームなんかだと、類似品生成させて作ったゲームを経営させれば、「売上」って判り易い基準で判断すると思う。

  • by Anonymous Coward on 2020年05月25日 16時46分 (#3821447)

    そんなコメントを思いついたら元タレコミのタイトルに書いてあった。
    どこで消えてしまったのだろう

    • by Anonymous Coward

      hylomがパクッと胃の中へ

  • by Anonymous Coward on 2020年05月25日 19時10分 (#3821577)

    と思ったけど人間が理解できなくてもいいから機械語か

    • by Anonymous Coward

      手書き部分はPython+PyTorchでウェイト設定ファイルはHDF5だろ
      NVIDIAだから

  • by Anonymous Coward on 2020年05月25日 20時01分 (#3821610)

    「パックマン」ということで色々思うことはある。
    まだプログラムの著作権が認められる前は「映画の著作物」として画面出力そのものが
    著作権違反だった時代もあるし、当時の判断基準ではアウトだろうな、とか。
    # あの事件そのものはデッドコピー基板だったけど。

    これ、例えば制約条件としてZ80インストラクションセットを食わせても
    古のパックマンのデッドコピーを出力したりはせんだろう?
    最初のうちは人間より質の悪いコード吐いてるだろうが、速度やサイズ優先の指定で
    人間を凌駕するすげぇアルゴリズムのコード吐くようになるんじゃね?
    いずれは関数の入出力仕様だけからコードを自動生成できるようになるんだろうが、
    その前段階としてAIオプチマイザってのが一瞬流行るかも。

    # 単純なソート作業を見せてやったとき、どんなアルゴリズムが生まれるかちょっと興味がある。

  • by Anonymous Coward on 2020年05月25日 20時21分 (#3821623)

    既存のものを学習させるんじゃなく、まったく見たことのない新しいゲームが見たいんだ。

    • by Anonymous Coward

      つまりその、数年前にあったCNN使って出力した悪夢のような動画的なものとか?

      まあもちろんそういうものではないんでしょうけど、何かの萌芽なのかも?

  • by Anonymous Coward on 2020年05月25日 20時27分 (#3821627)

    例えば古典的なビデオゲームのフロッガーとかスネークとかポンとかをたくさん学習させると
    そのうち今まで人間が考えたことの無い新しいゲームができるかも、ということでは?
    未来は単純なゲームなら無限に新しいゲームができる(遊べる)とか普通になるかもね

    • by Anonymous Coward

      GANの仕組み上、「フロッガー(スネーク、ポン)っぽいけど微妙に違うもの」にしかならなさそう。
      さらにそれを人間がプレイして面白いかどうかは全く保証されない。

      • by Anonymous Coward

        収束も保証されない上に、歪んだゲームとか滲んだゲームとかが量産される訳ですね!

typodupeerror

身近な人の偉大さは半減する -- あるアレゲ人

読み込み中...