[P] 行動模倣（Behavioral Cloning）＋LSTMで『バイオハザード4 リメイク』をプレイするAIを訓練した

Reddit r/MachineLearning / 2026/3/29

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

著者は、ゲームプレイの軌跡（例：走る、撃つ、リロードする、回避する）を記録し、観測された判断を模倣するために行動模倣（Behavioral Cloning）を用いて、『バイオハザード4 リメイク』をプレイするAIを訓練した。
時系列方向の記憶を持たせるためにLSTMを追加し、フレームごとの単純な模倣のみの場合と比べて、時刻ステップをまたいだ行動判断を改善した。
検証では、AIは単一の敵との遭遇に対しては比較的うまく対処できたが、複数の敵がいる状況での「戦うか逃げるか」といったより高度な戦術的判断では苦戦した。
投稿ではYouTubeでの内訳解説を共有しており、GitHubリポジトリを通じてソースコードとノートブックを提供しているため、他の人が同様の手法を再現したり発展させたりできる。

[P] I trained an AI to play Resident Evil 4 Remake using Behavioral Cloning + LSTM

RE4の村でのプレイ動画の軌跡を記録しました――走る、撃つ、リロードする、かわす――そして、Behavioral Cloning（行動クローニング）を使って、私の判断を模倣するモデルを学習させました。LSTMを追加したことで、AIが現在のフレームに反応するだけでなく、時間ステップをまたいで記憶を保持できるようにしました。

最も興味深い結果は、AIは単体の敵に対してはかなりうまく対処できた一方で、画面上に複数の敵が同時にいるときの「戦うか、逃げるか」の判断で苦労したことです。この微妙な点は、より多くのデータがないと模倣するのが難しかったです。

YouTubeで詳細な動画解説を公開しています。ソースコードとノートはこちら: https://github.com/paulo101977/notebooks-rl/tree/main/re4

このアプローチについての質問には喜んでお答えします。

submitted by /u/AgeOfEmpires4AOE4
[link] [comments]