マルチグレイン対応セマンティック・プロトタイプ・スキャンとトライ・トークン・プロンプト学習で高次RWKVを採用したパンシャープニング

arXiv cs.CV / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、RWKVの位置バイアスを抑えるために意味的に関連する領域を(ローカリティセンシティブハッシュを用いて)グルーピングし、文脈に応じたトークン再順序化を可能にする「マルチグレイン対応セマンティック・プロトタイプ・スキャン」をパンシャープニングに導入しています。
  • RWKV向けにトライ・トークン・プロンプト学習を提案し、グローバルトークン、クラスタ由来のプロトタイプトークン、学習可能なレジスタトークンの3要素を組み合わせることで、セマンティックな事前知識を強化しつつノイズの多い中間表現を抑制します。
  • 空間的な細部をより適切に保つため、中心差分畳み込みで高周波情報を注入し、さらにパラメータ増を抑えながら効率的かつロスレスな特徴変換を行う「可逆なマルチスケールQ-shift」を加えています。
  • 抽象(概要)に記載の実験結果では、提案手法がパンシャープニングにおいて既存手法より優れていると示されています。