InsTraj:移動意図を用いて拡散モデルに指示することで、現実世界の軌跡を生成する

arXiv cs.AI / 2026/4/7

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、自然言語による旅行意図から、現実的かつ制御可能なGPS軌跡を生成するためのフレームワークInsTrajを提案する。
  • 大規模言語モデルを用いて、構造化されていないユーザーの移動意図を意味的な「設計図(blueprint)」へ変換し、意図の表現と軌跡出力の間のギャップを埋める。
  • 次にInsTrajは、マルチモーダルな軌跡拡散トランスフォーマーを用いることで、高忠実度で指示に忠実な軌跡を生成しつつ、きめ細かな意図制約を尊重する。
  • 実世界データセットでの実験では、InsTrajが既存手法に対して、現実性、多様性、意味的忠実性の各面で優れていると報告されている。
  • 本研究は、都市計画、モビリティ・シミュレーション、プライバシーを保護したデータ共有といった主要なアプリケーション上のニーズを対象としており、制御性と現実的なばらつきの両方が不可欠である。

要旨: 現実的かつ制御可能なGPS軌跡の生成は、都市計画、モビリティシミュレーション、プライバシーを保護したデータ共有といった応用における基本的な課題である。 しかし、既存の手法には二重の課題がある。すなわち、複雑なユーザの移動意図を解釈するための深い意味理解が欠けていること、そして人間の行動に本来備わる現実的な多様性を維持しつつ複雑な制約を扱うことが難しいことである。 この問題を解決するために、自然言語による記述から直接高忠実度の軌跡を生成するよう拡散モデルに指示する新しい枠組み InsTraj を提案する。具体的には、InsTraj はまず強力な大規模言語モデルを用いて、自然言語によって形成された非構造な移動意図を解読し、それによって豊かな意味の設計図を作成するとともに、意図と軌跡の表現ギャップを埋める。続いて、微細なユーザ意図に従う高忠実度かつ指示に忠実な軌跡を生成するために、意味的ガイダンスを統合できるマルチモーダル軌跡拡散トランスフォーマーを提案した。 実世界のデータセットに対する包括的な実験により、InsTraj は、現実的で多様かつ入力指示に対して意味的に忠実な軌跡を生成する点で、最先端手法を大きく上回ることが示された。