視覚プロンプトの再考:Activation Prompts(活性化プロンプト)の力
arXiv cs.CV / 2026/4/9
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、「activation prompts(AP)」を提案し、VP(visual prompting)を拡張して入力に対してだけでなく、中間の活性化マップに対してユニバーサルな摂動を適用する。
- その結果として、VPの性能と効率は本質的に制約されていることを理論および実験を通じて主張・実証し、摂動をモデルのどこに適用するかによってAPがVPを上回り得ることを示す。
- APは、CNNやビジョントランスフォーマにおける正規化チューニングとの間に密接な関係があることを示すが、プロンプトが最も効果的に働く層については、モデルごとに異なる嗜好が存在する。
- 29のデータセットおよび複数のアーキテクチャにわたる大規模な実験により、APはVPおよびパラメータ効率の高い微調整のベースラインよりも高い精度と優れた効率を達成し、時間・パラメータ数・メモリ・スループットの改善を含むことが示される。




