分類ではなくシーングラフを生成できるか?FlowSG:フローマッチングによる進行型・画像条件付きシーングラフ生成
arXiv cs.CV / 2026/4/22
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- FlowSGは、SGG(Scene Graph Generation)を一度きりの分類ではなく、連続時間のフローマッチングに基づく進行型の生成タスクとして捉え直します。
- VQ-VAEでシーングラフ表現を離散トークンに量子化し、グラフトランスフォーマーで速度場とフロ—条件付きメッセージ伝播を用いてバウンディングボックスとカテゴリトークンを同時に段階的に更新します。
- 学習では、幾何学的な精緻化のためのフローマッチング損失と、オブジェクトおよび述語トークンのための離散フロー目的を組み合わせ、少ステップ推論を可能にしています。
- Visual Genome(VG)とPSGで(クローズド/オープン両ボキャブラリ設定で)評価し、述語のR/mRやグラフ全体の指標で一貫した改善が確認され、USG-Parに対して平均約3ポイントの向上を報告しています。
- FlowSGは標準的な検出器やセグメンターと「プラグアンドプレイ」互換になるよう設計されており、画像条件付きシーングラフ生成への実装面での実用性が示唆されます。
関連記事

ChatGPTが『依存』だとユーザーを疑う件について
note

【AI×マインドフルネス】SUNO AIで挑む「朝の活力」4分間瞑想ガイド制作記
note

【note更新、嫌になってませんか】告知ゼロで19,860円の記事が累計3本売れた夜に、私が見ている世界規模の油田の話。あなたは今、石油を掘っている自覚はありますか? #生成AI #AI活用 #noteで読めるマンガ #ChatGPTImages2.0 #ChatGPT #Claude #Gemini #Kindle出版 #nanobanana #note #情報発信 #ビジネス #noteの書き方 #副業 #マーケティング
note

XのAI、Grok(グロク)と宇宙や構成のお話するよ。まずはグロクの性格から!
note

XのAI、Grok(グロク)と宇宙や構成のお話するよ。まずはグロクの性格から!
note