AI Navigate

動的心の理論を時間的記憶問題として捉える: 大規模言語モデルからの証拠

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は DToM-Track を導入し、大規模言語モデル(LLMs)との制御された複数ターン対話における動的心の理論を時間的記憶問題として研究する評価フレームワークを提示する。
  • モデルはエージェントの現在の信念を確実に推測できる一方で、更新後に以前の信念状態を維持・検索するのに苦労することを示しており、時間的信念推論における非対称性を明らかにしている。
  • この困難はモデルファミリとスケールを問わず持続し、認知科学における最近性バイアスおよび干渉効果と一致する。
  • 心の理論を時間的表現と検索として位置づけることにより、本研究は LLM における社会的推論を核となる記憶機構と結び付け、拡張された人間とAIの相互作用に示唆を与える。

要旨:心の理論(Theory of Mind、ToM)は社会認知と人間-AIの相互作用の中核をなしており、大規模言語モデル(LLMs)はToMを理解し表現するのに用いられてきた。しかし、ほとんどの評価はToMを単一の瞬間の静的な判断として扱い、主に偽信念のテストに依存している。これは、ToMの時間を超えて信念を表現・更新・参照する能力という重要な動的次元を見落としている。私たちは動的ToMを時間的に拡張された表象メモリ問題として調査し、LLMsが現在の信念を推論するだけでなく、相互作用を通じて信念の軌跡を追跡できるかを問う。私たちはDToM-Trackを導入し、制御された複数ターン会話における時間的信念推論を調査する評価フレームワークであり、更新前に保持されていた信念の想起、現在の信念の推論、信念変化の検出をテストする。計算的プローブとしてLLMsを用いると、一貫した非対称性が見られる。モデルはエージェントの現在の信念を確実に推論する一方、更新が発生した後で以前の信念状態を維持・参照するのに苦労する。このパターンはLLMモデルファミリとスケールを超えて一貫して継続し、認知科学で広く文献化されている最近性バイアスと干渉効果と一致している。これらの結果は、時間を通じて信念の軌跡を追跡することが古典的な偽信念推論を超えた明確な課題を提示することを示唆している。ToMを時間的表現と検索の問題として位置づけることにより、本研究はToMを記憶と干渉の核となる認知機構につなげ、拡張された人間-AI相互作用における社会的推論におけるLLMモデルへの含意を浮き彫りにする。