広告

照明不変のTIR-LiDAR 人物追跡のためのデュアルストリーム・トランスフォーマー・アーキテクチャ

arXiv cs.RO / 2026/4/2

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、熱赤外(TIR)および LiDAR/深度センサを用いた、あらゆる天候に対応する人物追跡のためのデュアルストリーム・トランスフォーマー型アーキテクチャを提案し、暗所や逆光のような極端な照明条件下での RGB-D 追跡の失敗ケースを対象とする。
  • SLAM(自己位置推定と地図構築)に対応できる標準的なロボット用センサ構成(LiDAR と TIR カメラ)を活用し、自律移動ロボットによる信頼性の高い人の追従を目的とした、実運用を見据えた TIR-D 追跡システムを構築する。
  • 主要なボトルネックとして、注釈付きのマルチモーダル TIR-D データセットが限られている点を取り上げ、著者らは、大規模な熱学習モデルから TIR-D ドメインへ構造的な事前知識(プリオル)を転移する逐次的な知識転移手法によりこれを解決する。
  • 本手法では、「きめ細かな差分学習率戦略(Fine-grained Differential Learning Rate Strategy)」を用い、事前学習済みの特徴抽出を保持しつつ、追跡タスクに必要な幾何学的な深度手がかりへ迅速に適応する。
  • 実験では、RGB 転移および単一モダリティのベースラインよりも性能が向上し、平均オーバーラップ(AO)0.700、成功率(SR)58.7%が報告されている。

広告