OV-Stitcher：学習不要のオープン語彙セマンティックセグメンテーションのための、グローバルな文脈対応フレームワーク

arXiv cs.CV / 2026/4/10

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

OV-Stitcherは、エンコーダの入力解像度の制約によりスライディングウィンドウの切り出しに依存する既存手法を改善する、学習不要のオープン語彙セマンティックセグメンテーションのためのフレームワークとして提案される。
サブ画像を個別に処理する代わりに、OV-Stitcherは最終エンコーダブロック内で分断されたサブ画像特徴を「stitch（縫い合わせ）」、画像全体のグローバルな文脈に対する注意（attention）表現を再構成する。
この設計により、先行する学習不要ベースラインと比べて、より首尾一貫した文脈の集約と、空間的に整合し意味的に整列したセグメンテーション出力が得られる。
8つのベンチマークにわたる実験では、既存の学習不要手法に対してmIoUが48.7から50.7へと向上しており、オープン語彙セグメンテーションに対するスケーラブルな性能の向上が示される。

AI Business

日経XTECH

日経XTECH

日経XTECH

Reddit r/artificial