SAT:画像超解像のための選択的集約トランスフォーマ
arXiv cs.CV / 2026/4/10
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、標準的な自己注意に伴う高い二次コストを克服しつつ、長距離依存のモデリングを維持することを目的として、画像超解像のための選択的集約トランスフォーマ(Selective Aggregation Transformer: SAT)を提案する。
- SATは、クエリ行列をフル解像度のまま保って復元の忠実性を維持しつつ、キー・バリュー表現を選択的に集約することで、トークン数を大幅に削減する(報告では97%削減)。
- 密度に駆動したトークン集約アルゴリズムにより、密度と孤立度の指標を用いてクラスタ表現を同定し、重要な高周波の画像詳細をより適切に保持する。
- 実験では、SATが従来の最先端手法(PFT)を最大0.22 dB上回り、総FLOPsを最大27%削減できることが報告されている。
- この手法は、大域的な相互作用に対してスケーラブルであり、品質への大きなトレードオフなしに、トランスフォーマベースの超解像をより効率化するものとして位置づけられている。


