MATT-Diff：拡散ポリシーによるマルチモーダル能動的ターゲット追跡

arXiv cs.RO / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureModels & Research

共有:

要点

MATT-Diffは、移動エージェントによる能動的マルチターゲット追跡のための拡散ポリシー型の制御手法で、ターゲットの数・状態・ダイナミクスを事前に知らなくても、探索・追跡・再捕捉といった複数の行動モードを実現します。
この方法は、検出されたものの不確実性が高いターゲットに対する不確実性低減（搾取）と、未検出または見失ったターゲットに対する探索（探索行動）のバランスを取れるように設計されています。
本論文では、3種類のエキスパートプランナ（フロンティアベース探索、不確実性に基づく探索/追跡の切替、検出時間に基づく探索/再捕捉の切替）を用いてデモンストレーションデータセットを作成し、多峰性（マルチモーダル）な行動を学習できるようにしています。
MATT-Diffは、視点（エゴセントリック）マップのトークン化にビジョントランスフォーマを用い、ターゲット推定をガウス密度として表した可変入力を統合するために注意機構を用います。また、拡散のデノイジング過程で多峰性の行動系列を学習します。
実験では、新しい環境において学習ベースの他手法よりも追跡性能が高く、マルチモーダルな挙動が複数のエキスパートプランナ由来の多様性を反映することが示されており、実装はGitHubで公開されています。

要旨: 本論文は、モバイルエージェントによるアクティブなマルチターゲット追跡のための制御ポリシーである、MATT-Diff: 拡散ポリシーによるマルチモーダル・アクティブ・ターゲット追跡を提案する。提案ポリシーは、ターゲット数・状態・ダイナミクスに関する事前知識を持たなくても、探索、追跡、ならびにターゲットの再獲得を含む、エージェントの複数の行動モードを可能にする。有効なターゲット追跡には、未検出または見失ったターゲットに対する探索と、検出されているが不確かなターゲットに対する活用（すなわち不確実性の低減）のバランスが必要である。我々は、3つのエキスパートプランナーからデモンストレーションデータセットを生成する。これには、フロンティアベースの探索、フロンティアベースの探索とRRT*による追跡を不確実性に基づいて切り替える不確実性ベースのハイブリッドプランナー、ならびにターゲット検出時刻に基づいて探索とターゲットの再獲得を切り替える時間ベースのハイブリッドプランナーが含まれる。我々の制御ポリシーは、自己中心視点の地図トークン化にビジョントランスフォーマーを用い、ガウス密度として表現される変動するターゲット推定値を統合するための注意機構を利用する。拡散モデルとして学習することで、ポリシーは復元（デノイジング）の過程を通じて、モーダルな（複数通りの）行動系列を生成することを学習する。評価の結果、MATT-Diffは未知の環境において、他の学習ベースのベースラインに対して優れた追跡性能を示し、また複数のエキスパートプランナーに由来するモーダルな行動も実現できることが示された。本手法の実装は https://github.com/CINAPSLab/MATT-Diff で公開している。