分類ではなくシーングラフを生成できるか?FlowSG:フローマッチングによる進行型・画像条件付きシーングラフ生成

arXiv cs.CV / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • FlowSGは、SGG(Scene Graph Generation)を一度きりの分類ではなく、連続時間のフローマッチングに基づく進行型の生成タスクとして捉え直します。
  • VQ-VAEでシーングラフ表現を離散トークンに量子化し、グラフトランスフォーマーで速度場とフロ—条件付きメッセージ伝播を用いてバウンディングボックスとカテゴリトークンを同時に段階的に更新します。
  • 学習では、幾何学的な精緻化のためのフローマッチング損失と、オブジェクトおよび述語トークンのための離散フロー目的を組み合わせ、少ステップ推論を可能にしています。
  • Visual Genome(VG)とPSGで(クローズド/オープン両ボキャブラリ設定で)評価し、述語のR/mRやグラフ全体の指標で一貫した改善が確認され、USG-Parに対して平均約3ポイントの向上を報告しています。
  • FlowSGは標準的な検出器やセグメンターと「プラグアンドプレイ」互換になるよう設計されており、画像条件付きシーングラフ生成への実装面での実用性が示唆されます。