ラベル伝播を用いた半教師あり物体セグメンテーションによる効率的な画像アノテーション

arXiv cs.CV / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • この論文は、サービスロボット向けの家庭内物体セグメンテーションを対象に、完全にラベル付けされた学習データへの依存を減らす半教師ありのラベル伝播手法を提案している。
  • クラス非依存のセグメント提案器がマスクを生成し、Hopfieldネットワークのアンサンブルが代表的な埋め込みを学習することでラベルを割り当てる。埋め込み空間にはCLIP、ViT、Theiaの複数の基盤モデル表現を用いる。
  • 50クラス規模までスケールし、アノテーションの負担を抑えられるとされており、小数クラスでは有効でも広いカテゴリへ一般化しにくいオープン語彙検出器の課題に対応する。
  • RoboCup@Homeのように準備時間が厳しい環境で、データの約60%を自動的にラベル付けできるという主張がなされている。
  • データセットとコードは公開されており、他者が再現・発展させやすい。

Abstract

信頼できる物体認識は、汎用サービスロボットにとって必要不可欠です。オープンワードの検出器は、限られたいくつかのクラスを超えて一般化することが難しく、物体検出器の完全教師あり学習は、時間を要する注釈が必要です。私たちは、家庭内オブジェクトのセグメンテーションに対する半教師ありのラベル伝播アプローチを提示します。セグメント提案器はクラス非依存のマスクを生成し、Hopfieldネットワークのアンサンブルは、補完的な基盤モデルの埋め込み空間(CLIP、ViT、Theia)において代表的な埋め込みを学習することでラベルを割り当てます。私たちのアプローチは、限られた注釈オーバーヘッドで50の物体クラスまでスケールでき、準備時間が厳しく制約されるRoboCup@Homeの設定においてデータの60%を自動的にラベル付けできます。データセットとコードは https://github.com/ais-bonn/label_propagation で公開されています。