分類ではなくシーングラフを生成できるか？FlowSG：フローマッチングによる進行型・画像条件付きシーングラフ生成

arXiv cs.CV / 2026/4/22

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

FlowSGは、SGG（Scene Graph Generation）を一度きりの分類ではなく、連続時間のフローマッチングに基づく進行型の生成タスクとして捉え直します。
VQ-VAEでシーングラフ表現を離散トークンに量子化し、グラフトランスフォーマーで速度場とフロ—条件付きメッセージ伝播を用いてバウンディングボックスとカテゴリトークンを同時に段階的に更新します。
学習では、幾何学的な精緻化のためのフローマッチング損失と、オブジェクトおよび述語トークンのための離散フロー目的を組み合わせ、少ステップ推論を可能にしています。
Visual Genome（VG）とPSGで（クローズド/オープン両ボキャブラリ設定で）評価し、述語のR/mRやグラフ全体の指標で一貫した改善が確認され、USG-Parに対して平均約3ポイントの向上を報告しています。
FlowSGは標準的な検出器やセグメンターと「プラグアンドプレイ」互換になるよう設計されており、画像条件付きシーングラフ生成への実装面での実用性が示唆されます。