DLink:EEG基盤モデルから層ごとの知識と支配的知識を蒸留する
arXiv cs.LG / 2026/4/17
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- この論文は、組込み型BCI向けにEEG基盤モデルを低コストで動かすための知識蒸留フレームワーク「DLink」を提案しています。
- EEG基盤モデルではタスクに必要な情報が中間層に分散しており、単純な次元削減が表現の崩壊や発振(オシレーション)構造の歪みを引き起こしやすいため、従来手法がうまく機能しにくいと指摘しています。
- DLinkは、教師層を動的に集約するRouter、Mimic-then-Compressで学習するEEG MiC学生モデル、周波数領域で表現を一致させるスペクトル蒸留の3つを組み合わせています。
- 4つのEEGベンチマークで評価した結果、コンパクトな学生モデルが軽量ベースラインを上回り、モデルサイズと推論コストを大幅に抑えつつ、完全微調整済みの基盤モデルに近い性能を達成しています。
- 全体として、発振構造を保ちながらリソース制約のある組込み環境に基盤モデル相当の能力を持ち込むための実用的な方針を示しています。
