| RE4の村でのプレイ動画の軌跡を記録しました――走る、撃つ、リロードする、かわす――そして、Behavioral Cloning(行動クローニング)を使って、私の判断を模倣するモデルを学習させました。LSTMを追加したことで、AIが現在のフレームに反応するだけでなく、時間ステップをまたいで記憶を保持できるようにしました。 最も興味深い結果は、AIは単体の敵に対してはかなりうまく対処できた一方で、画面上に複数の敵が同時にいるときの「戦うか、逃げるか」の判断で苦労したことです。この微妙な点は、より多くのデータがないと模倣するのが難しかったです。 YouTubeで詳細な動画解説を公開しています。ソースコードとノートはこちら: https://github.com/paulo101977/notebooks-rl/tree/main/re4 このアプローチについての質問には喜んでお答えします。 [link] [comments] |
[P] 行動模倣(Behavioral Cloning)+LSTMで『バイオハザード4 リメイク』をプレイするAIを訓練した
Reddit r/MachineLearning / 2026/3/29
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 著者は、ゲームプレイの軌跡(例:走る、撃つ、リロードする、回避する)を記録し、観測された判断を模倣するために行動模倣(Behavioral Cloning)を用いて、『バイオハザード4 リメイク』をプレイするAIを訓練した。
- 時系列方向の記憶を持たせるためにLSTMを追加し、フレームごとの単純な模倣のみの場合と比べて、時刻ステップをまたいだ行動判断を改善した。
- 検証では、AIは単一の敵との遭遇に対しては比較的うまく対処できたが、複数の敵がいる状況での「戦うか逃げるか」といったより高度な戦術的判断では苦戦した。
- 投稿ではYouTubeでの内訳解説を共有しており、GitHubリポジトリを通じてソースコードとノートブックを提供しているため、他の人が同様の手法を再現したり発展させたりできる。




