異種ディベート・エンジン：強靱なLLMベース倫理チュータリングのためのアイデンティティに基づく認知アーキテクチャ

arXiv cs.AI / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、制約のないマルチエージェント構成で見られる意味のドリフトや論理の劣化を抑えることで、LLMベースの倫理チュータリングにおけるより安定した弁証的相互作用を可能にする「Heterogeneous Debate Engine（HDE）」を提案する。
HDEは、教義の忠実性を強制するためのアイデンティティに基づくRetrieval-Augmented Generation（ID-RAG）と、討論中における相手の戦略をモデル化するためのヒューリスティックな心の理論（Theory of Mind）モジュールを組み合わせる。
著者らは、先行アプローチでは弁証が停滞し循環的な同意に陥り得ると主張し、教義の正しさと生産的な生成の柔軟性の両方を維持するための設計上の制約を提案している。
評価では、最初の教義的コミットメントの異種性（例：義務論（Deontology）対功利主義（Utilitarianism））が、ベースライン手法と比べて学生のArgument Complexity Scoreを約1桁（order of magnitude）増加させることが示される。
結果は、倫理チュータリングの状況において高忠実度かつ敵対的な教育を維持するためのアーキテクチャ要件として、ID-RAGとヒューリスティックToMを検証するものとして提示される。

要旨: 大規模言語モデル（LLM）は、複雑な推論タスクにおいて自律エージェントとしてますます活用されるようになっており、弁証的な対話が切り拓かれる余地が生まれている。しかし、体系的に制約のない仕組みで実装されたマルチエージェントシステムは、意味のドリフトや論理の劣化を系統的に引き起こし、そのため、正確な答えが必要とされる倫理的チュータリングの提供にはほとんど用いることができない。現在のシミュレーションは、しばしば弁証的な停滞へと退化する傾向があり、エージェントは再帰的な同意や循環する議論へと劣化していく。解決すべき重大な課題は、弁証的推論に必要な生成的柔軟性を抑え込むことなく、教義（ドクトリン）の忠実性をどのように強制するかである。このニッチに対処するため、我々は異種討論エンジン（Heterogeneous Debate Engine, HDE）を提案する。これは、教義の忠実性のためのアイデンティティに基づく検索拡張生成（Identity-Grounded Retrieval-Augmented Generation, ID-RAG）と、戦略的な対戦相手モデリングのためのヒューリスティックな心の理論（Heuristic Theory of Mind）を組み合わせた認知アーキテクチャである。評価の結果、アーキテクチャの異種性は安定性にとって重要な変数であることが示された。反対の教義的初期化（例：義務論 vs 功利主義）によって、学生の議論複雑度スコアは、ベースラインに比べて1桁（オーダー）大きく増加した。これらの結果は、高忠実度（敵対的）な教育実践を維持するためのアーキテクチャ上の要件として、ID-RAGとヒューリスティックToMが有効であることを裏付ける。