有界相互作用に対するマイヒル=ネロードの定理:エージェント有界の識別不能性による正準的な抽象化
arXiv cs.AI / 2026/3/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、容量制限された観測者に対するマイヒル=ネロードの定理の有界相互作用アナログを提案し、どのような容量制限されたエージェントも識別できない観測履歴を同一視することで、その観測者が環境上に誘導する正準な商(クオティエント)を示す。
- 有限POMDPに対して、有限状態コントローラの固定されたファミリを用いて閉ループのワッサースタイン擬計量を構成し、それに基づき、(有界な識別不能性の概念において)正準的・最小的で一意な「プローブ正確(probe-exact)な商」を導出する。
- 「時計を意識した(clock-aware)」プローブ設定を導入し、その結果得られる商が、エージェントの観測と行動のみに依存する目的に対して決定に十分であることを示す。さらに、観測リプシッツ条件により、潜在状態に報酬がある設定に対する近似境界も与える。
- 主な理論的対象は実験と組み合わせており、大規模化可能な決定論的・定常的な粗視化を探究する。TigerやGridWorldといった代表的ベンチマークで検証されるほか、RockSampleを含む一連の診断的ケーススタディにより、近似の計算時間や振る舞いを調べる。