RegFormer:効率的な弱教師あり人・物体インタラクション検出のための、転移可能な関係的グラウンディング
arXiv cs.CV / 2026/4/2
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- RegFormerは、詳細な位置特定ラベルではなく画像レベルのアノテーションのみを用いる弱教師あり人・物体インタラクション(HOI)検出のための、効率的なインタラクション認識モジュールとして提案される。
- この手法は、多数の人–物体インスタンスペアを列挙することによる従来のスケーリング限界に対処し、空間的に根拠づけられたガイダンスと、局所性を考慮したインタラクション学習によって改善する。
- インタラクションのない人–物体の組合せによる誤検出(false positives)を軽減するために、人・物体・そして真のインタラクションをより適切に分離できる、局在したインタラクション手がかりを学習する。
- 本モデルは、画像レベルのインタラクション推論をインスタンスレベルのHOI推論へ、追加学習なしで転移できるよう設計されており、完全教師ありアプローチに匹敵する精度の到達を目指す。
- 提供されているGitHubリポジトリを通じてコードを公開し、再現性と導入を支援する。



