要旨: 実行可能なステップから構成される行動シーケンスは、旅行計画などの多重制約の計画問題における運用上の基盤をなします。この種のタスクでは、各計画ステップは局所的に制約されるだけでなく、複数のサブタスクにまたがるグローバルな制約によっても影響を受け、その結果、密結合で複雑な意思決定プロセスになります。既存の旅行計画手法は一般に、すべてのサブタスクと制約を絡め合わせた単一の意思決定空間に依存しており、サブタスク内で局所的に作用する制約と、複数のサブタスクにまたがるグローバル制約とを区別できていません。そのため、各意思決定ステップごとに、モデルは局所制約とグローバル制約の双方を同時に推論せざるを得ず、推論負担が増大し、計画効率が低下します。この問題に対処するために、我々はBehavior Forest(行動の森)手法を提案します。具体的には、提案手法では意思決定プロセスを並列な行動ツリーの森として構造化し、各行動ツリーがサブタスクを担当するようにします。これらのツリー間の相互作用を調整するためのグローバルな協調メカニズムを導入し、モジュール化された一貫性のある旅行計画を可能にします。この枠組みの中で、大規模言語モデルを行動ツリーノード内の意思決定エンジンとして埋め込み、タスク固有の制約に条件付けされた局所的推論を行うことで候補となるサブプランを生成し、協調フィードバックに基づいて意思決定を適応させます。行動ツリーはさらに、LLM生成を導く明示的な制御構造を提供します。この設計により、複雑なタスクと制約を扱いやすいサブ空間へと分離し、タスク固有の推論を可能にすることで、LLMの認知負荷を軽減します。実験結果では、本手法がTravelPlannerで従来の最先端手法より6.67%優れ、ChinaTravelベンチマークで11.82%上回ることが示されており、複雑な多重制約の旅行計画におけるLLMの性能向上に有効であることが実証されています。
Behavior Forestによる行動の分解型旅行計画
arXiv cs.LG / 2026/4/24
📰 ニュースModels & Research
要点
- この論文は、多制約の旅行計画が難しい理由として、従来手法がサブタスク内の局所的な制約と、サブタスク間にまたがるグローバル制約を絡めてしまい、毎ステップで同時に推論させて非効率になる点を指摘しています。
- 「Behavior Forest」では、意思決定を複数の並列な行動木(ビヘイビアツリー)へ分解し、それぞれを特定のサブタスク担当とする一方、全体の整合性を保つためのグローバルな協調メカニズムを導入します。
- 行動木の各ノード内に大規模言語モデルを局所的な意思決定エンジンとして組み込み、サブタスク固有の制約に基づいて候補サブプランを生成し、協調からのフィードバックで意思決定を調整します。
- 行動木の構造がLLM生成の制御(ガイド)として働き、複雑な手順を明示的に扱えるようにして、認知負荷の低減を狙います。
- 実験では既存の最先端手法より改善が報告されており、TravelPlannerで+6.67%、ChinaTravelで+11.82%の向上が示され、制約が多い複雑な計画で有効性が確認されます。


