MetaDAT: メタ事前学習とデータ適応型テスト時更新による汎用的な軌跡予測

arXiv cs.CV / 2026/3/11

Ideas & Deep AnalysisModels & Research

要点

  • 本論文は、テスト時の分布シフトに伴う軌跡予測モデルの性能劣化という課題に対し、高速かつ正確なオンライン適応を可能にする新しいメタラーニングフレームワークを提案している。
  • 提案手法は、事前学習時に二重最適化を行い、予測器を効果的なテスト時適応タスクに備える。
  • テスト時には、オンラインの偏微分や難易度の高いサンプル選択に基づき、学習率や更新頻度を動的に調整するデータ適応型モデル更新機構を導入し、効率性と精度を向上させる。
  • nuScenes、Lyft、Waymoなどのクロスデータセットシナリオでの実験により、既存のテスト時トレーニング手法を上回る性能を示し、最適でない条件下でも優れた頑健性と実用性を実証している。
  • 本手法は、高いフレームレートと正確な軌跡予測を必要とする困難な環境におけるリアルタイムオンライン学習と適応に対するモデルの柔軟性を高める。

計算機科学 > コンピュータビジョンとパターン認識

arXiv:2603.09419 (cs)
[2026年3月10日 投稿]

題名:MetaDAT: Meta Pre-training とデータ適応型テスト時更新による汎化可能な軌跡予測

MetaDAT: Meta Pre-training とデータ適応型テスト時更新による汎化可能な軌跡予測、Yuning Wang および他4名の著者による論文のPDFを表示
PDFを表示 HTML(実験的)
要旨:既存の軌跡予測手法は、テスト時に分布がずれた場合、性能が大きく低下することが知られています。テスト時学習(test-time training)の手法は、適応を可能にするために検討されてきましたが、現行のアプローチはオンライン学習の柔軟性を欠くオフラインで事前学習された予測器に依存しています。さらに、それらはテストデータ固有の特性に対応できない固定されたオンラインモデル更新ルールにも依存しています。これらの制約に対処するために、まず我々は、高速かつ正確なオンライン適応のために予測器を直接最適化するメタ学習の枠組みを提案します。この枠組みは、事前学習時にシミュレーションされたテスト時適応タスクの性能に対して二階層(bi-level)最適化を行います。加えて、テスト時には、オンラインの部分導関数と難しいサンプルの選別に基づいて、事前に定義された学習率と更新頻度を動的に調整するデータ適応型のモデル更新メカニズムを導入します。このメカニズムにより、オンライン学習率はテストデータに適合し、情報量のある難しいサンプルに焦点を当てることで効率を高めます。実験は、nuScenes、Lyft、Waymo を含む、さまざまな困難なクロスデータセット分布シフトの状況で実施しました。その結果、提案手法は適応精度において優れており、軌跡予測における最先端のテスト時学習手法を上回ることが示されました。さらに、本手法は学習率が不十分な場合や高FPSの要求下でも性能を発揮し、その頑健性と実用性を示しています。
コメント:
対象分野: コンピュータビジョンとパターン認識 (cs.CV)
引用: arXiv:2603.09419 [cs.CV]
  (あるいは、このバージョンでは arXiv:2603.09419v1 [cs.CV])
  https://doi.org/10.48550/arXiv.2603.09419
詳しく学ぶためにここにフォーカス
DataCite 経由で発行された arXiv-issued DOI

投稿履歴

発信元: Yuning Wang [メールを表示]
[v1] 2026年3月10日(火) 09:34:32 UTC (1,577 KB)
全文リンク:

論文へのアクセス:

現在の閲覧コンテキスト:
cs.CV
< prev   |   next >
参照方法を切り替え:
cs
BibTeX形式の引用をエクスポート 読み込み中...

BibTeX形式の引用

×
提供データ:

ブックマーク

BibSonomyロゴ Redditロゴ
書誌ツール

書誌および引用ツール

書誌エクスプローラー切り替え
書誌エクスプローラー (エクスプローラーとは?)
Connected Papers切り替え
Connected Papers (Connected Papersとは?)
Litmaps切り替え
Litmaps (Litmapsとは?)
scite.ai切り替え
scite スマート引用 (スマート引用とは?)
コード、データ、メディア

この記事に関連付けられたコード、データ、メディア

alphaXiv切り替え
alphaXiv (alphaXivとは?)
コードへのリンク切り替え
論文のためのCatalyzeX Code Finder (CatalyzeXとは?)
DagsHub トグル
DagsHub (DagsHubとは?)
GotitPub トグル
Gotit.pub (GotitPubとは?)
Huggingface トグル
Hugging Face (Huggingfaceとは?)
コードへのリンク トグル
Papers with Code (Papers with Codeとは?)
ScienceCast トグル
ScienceCast (ScienceCastとは?)
デモ

デモ

Replicate トグル
Replicate (Replicateとは?)
Spaces トグル
Hugging Face Spaces (Spacesとは?)
Spaces トグル
TXYZ.AI (TXYZ.AIとは?)
関連論文

レコメンダーおよび検索ツール

Influence Flower へのリンク
Influence Flower (Influence Flowerとは?)
Core レコメンダー トグル
CORE レコメンダー (COREとは?)
arXivLabs について

arXivLabs:コミュニティの協力者とともに取り組む実験的プロジェクト

arXivLabs は、協力者が当社の Web サイト上で新しい arXiv の機能を直接開発し、共有できるようにするためのフレームワークです。

arXivLabs に取り組む個人および組織は、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、これらに同意しています。arXiv はこれらの価値観に尽力しており、それらに従うパートナーとのみ連携します。

arXiv のコミュニティに価値をもたらすプロジェクトのアイデアはありますか? arXivLabs についてもっと知る