AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

離散コサイン変換に基づくデコリレート・アテンション：ビジョントランスフォーマーのために

arXiv cs.CV / 2026/5/4

💬 オピニオンModels & Research

原文を読む →

共有:

要点

本論文は、離散コサイン変換（DCT）を活用して、ビジョントランスフォーマーにおける自己注意のクエリ／キー／バリュー射影のランダム初期化を改善しつつ計算コストを抑えることを提案しています。
DCT係数を用いた自己注意の初期化手法を導入し、構造を保持しながらCIFAR-10とImageNet-1Kで一貫した分類精度の向上を示しています。
さらに、周波数領域のデコリレーション性質を利用して入力パッチの高周波DCT成分を打ち切り、射影の次元を削減しつつ精度を維持するDCTベースのアテンション圧縮も提案しています。
Swin Transformerでの実験では、圧縮により計算オーバーヘッドを大きく削減しながら、性能は同等に保たれることを報告しています。

関連記事

Power PlatformにおけるALM：ADO＋GitHubで「両方の良いところ」を取る

Power PlatformにおけるALM：ADO＋GitHubで「両方の良いところ」を取る

Dev.to

実験：RAGライク構成でChatGPT 5.4の出力は反復利用で変わるのか？

実験：RAGライク構成でChatGPT 5.4の出力は反復利用で変わるのか？

Dev.to

「覚えたルール」がバグにも都合よく当てはまるとき——エージェントワークフローのメタトラップ

「覚えたルール」がバグにも都合よく当てはまるとき——エージェントワークフローのメタトラップ

Dev.to

LWiAIポッドキャスト #243 - GPT 5.5、DeepSeek V4、AI安全の妨害

LWiAIポッドキャスト #243 - GPT 5.5、DeepSeek V4、AI安全の妨害

Last Week in AI

マルチモーダルAI「Flamingo」を読むための前提知識まとめ②（Catastrophic Forgetting、Frozen backbone、セルフアテンションとクロスアテンション、自己回帰モデル）

マルチモーダルAI「Flamingo」を読むための前提知識まとめ②（Catastrophic Forgetting、Frozen backbone、セルフアテンションとクロスアテンション、自己回帰モデル）

Qiita

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告