PiLoT:UAVベースの自車両および目標のジオローカライゼーションのための、ニューラル・ピクセルから3Dへの登録
arXiv cs.CV / 2026/3/24
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- PiLoTは、ライブ映像ストリームをジオ参照された3D地図へ直接登録し、自車姿勢と目標のジオローカライゼーションの両方を推定する、統一的なUAVローカライゼーションの枠組みである。GNSSへの依存や個別のアクティブセンサに頼る度合いを低減する。
- 双方向スレッド・エンジン(Dual-Thread Engine)により、地図レンダリングとローカライゼーション中核を分離してレイテンシを低く保ちつつドリフトを回避し、リアルタイム性能と精度を向上させる。
- 正確な幾何学的注釈(カメラ姿勢と深度マップ)を備えた大規模な合成トレーニングデータセットを導入し、シミュレーションから実世界データへの汎化をゼロショットで可能にする軽量ネットワークを学習する。
- 急激なUAVの運動下でも頑健な収束を維持するために、Joint Neural-Guided Stochastic-Gradient Optimizer(JNGO)を提案する。
- 複数の公開ベンチマークおよび新たに収集したベンチマークでの実験により、最先端の性能を報告しつつ、NVIDIA Jetson Orin上で25 FPS超を達成する。コードとデータセットはGitHubで公開されている。