FluidWorld:反応拡散ダイナミクスを予測的サブストレートとして用いるワールドモデル
arXiv cs.LG / 2026/3/24
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、反応拡散のPDEを直接積分することで将来状態を予測するワールドモデル「FluidWorld」を提案する。別個のTransformerやConvLSTMの予測器ネットワークを用いるのではない。
- UCF-101の動画予測(64×64)における制御されたアブレーション実験で、FluidWorldは1ステップ予測の損失では同等だが、自己注意TransformerベースラインおよびConvLSTMベースラインの両方よりも再構成誤差が大幅に良い。
- FluidWorldが学習した表現は、空間構造の保持が改善している(10〜15%高い)こと、また有効次元性が高い(18〜25%多い)ことが示され、空間情報のより良い保持が示唆される。
- TransformerやConvLSTMのベースラインとは異なり、FluidWorldはより首尾一貫した多ステップのロールアウトを維持し、他モデルは劣化がより急速である。
- この手法は、PDEによる拡散により空間計算量がO(N)となるなど、計算効率(空間効率)が高いと主張されており、大規模な計算環境を用いずに、単一の一般的な消費者PCで学習・推論を行ったことを示している。
広告




