広告

RegFormer:効率的な弱教師あり人・物体インタラクション検出のための、転移可能な関係的グラウンディング

arXiv cs.CV / 2026/4/2

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • RegFormerは、詳細な位置特定ラベルではなく画像レベルのアノテーションのみを用いる弱教師あり人・物体インタラクション(HOI)検出のための、効率的なインタラクション認識モジュールとして提案される。
  • この手法は、多数の人–物体インスタンスペアを列挙することによる従来のスケーリング限界に対処し、空間的に根拠づけられたガイダンスと、局所性を考慮したインタラクション学習によって改善する。
  • インタラクションのない人–物体の組合せによる誤検出(false positives)を軽減するために、人・物体・そして真のインタラクションをより適切に分離できる、局在したインタラクション手がかりを学習する。
  • 本モデルは、画像レベルのインタラクション推論をインスタンスレベルのHOI推論へ、追加学習なしで転移できるよう設計されており、完全教師ありアプローチに匹敵する精度の到達を目指す。
  • 提供されているGitHubリポジトリを通じてコードを公開し、再現性と導入を支援する。

広告