LiPS：リソース制約下のロボティクス向け軽量パンオプティックセグメンテーション

arXiv cs.RO / 2026/4/2

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、モバイルロボットのようなリソース制約のあるプラットフォーム上で、現代のクエリベースのロボティック認識を実現可能にするための軽量なパンオプティックセグメンテーションモデル「LiPS」を提案する。
LiPSはクエリベースのデコーディング手法は維持しつつ、より重い処理パイプラインを、計算コストを削減するための合理化された特徴抽出および特徴融合の経路に置き換える。
ベンチマーク評価では、LiPSが、より大規模なベースラインと同等の精度を達成しながら、効率を大幅に改善できることが示される。
得られた改善として、最大4.5×のスループット（FPS）向上と、計算量の約6.8×削減が報告されており、SOTAモデルとリアルタイムロボティクスの実用的な橋渡しとして位置づけられている。
全体として本研究は、ロボティクスに必要とされるセマンティック情報に加えてオブジェクトレベルの推論を支える強力なパンオプティックセグメンテーション性能を維持しつつ、導入制約（レイテンシ／計算）を主眼としている。

要旨: パノプティックセグメンテーションは、ロボット知覚のための重要な実現要因です。これは、意味理解を物体レベルの推論と統合するためです。しかし、最先端モデルの複雑性が増すにつれて、それらはモバイルロボットのようなリソース制約のあるプラットフォームへの実装には不向きになっています。そこで本研究では、LiPSと呼ばれる新しいアプローチを提案します。これは、クエリベースのデコーディングを保持しつつ、簡素化された特徴抽出と融合の経路を導入することで、「計算効率の良い」パノプティックセグメンテーションという課題に対処します。計算負荷を大幅に低減しながら、強力なパノプティックセグメンテーション性能を提供することを目指します。標準的なベンチマークでの評価により、LiPSははるかに重い基準手法に匹敵する精度を達成しつつ、1秒あたりのフレーム数（frames per second）で最大4.5倍のスループットを提供し、計算を必要とする量はほぼ6.8分の1であることが示されます。この効率性により、LiPSは現代のパノプティックモデルと現実世界のロボット応用との間をつなぐ、非常に関連性の高いブリッジとなります。