AI Navigate

SENSE: プライバシー保護型セマンティック検索による効率的な EEG からテキストへの変換

arXiv cs.LG / 2026/3/19

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • SENSE は、LLM のファインチューニングを回避する、軽量でプライバシーを保護する EEG からテキストへのフレームワークを導入し、デコーディングを端末内のセマンティック検索とプロンプトベースの言語生成に分離します。
  • EEG-to-keyword モジュールは EEG 信号を離散的な Bag-of-Words 空間にマッピングし、約600万パラメータの端末上で動作します。生データを局所に保持し、共有されるのはセマンティックな手がかりだけです。
  • 市販のLLMをゼロショット設定で条件付けて流暢なテキストを合成します。Thought2Text などのベースラインと同等かそれ以上の品質を達成しつつ、計算オーバーヘッドを削減します。
  • 128チャネル EEG データセットを6名の被験者に対して評価したところ、本手法は将来のBCIに向けた、スケーラブルでプライバシーを意識した検索強化型アーキテクチャを示します。

要旨:脳の活動を自然言語へデコードすることは、AIにおける主要な課題であり、支援通信、神経技術、ヒューマン-コンピュータ相互作用といった重要な応用を有します。既存の多くのブレイン-コンピューター・インターフェイス(BCI)アプローチは、生のEEG信号上での大規模言語モデル(LLMs)やエンコーダ-デコーダモデルのメモリ集約的な微調整に依存しており、結果として高価なトレーニングパイプライン、限られたアクセス性、および機微な神経データの露出の可能性を招きます。我々はSENSE(SEmantic Neural Sparse Extraction)、LLMの微調整なしに非侵襲的な脳波計(EEG)をテキストへ翻訳する、軽量でプライバシー保護的なフレームワークを紹介します。SENSEはデコードを二段階に分離します:デバイス上での意味検索とプロンプトベースの言語生成。EEG信号はローカルに離散的なテキスト空間へマッピングされ、機密性の低いBoW(Bag-of-Words)を抽出し、これが市販のLLMを条件付けてゼロショット方式で流暢なテキストを合成します。EEGからキーワードへのモジュールは約6Mパラメータしか含まず、完全にデバイス上で動作し、生の神経信号は局所にとどまり、抽象的な意味手掛かりだけが言語モデルと相互作用します。六名の被験者を対象とした128チャネルのEEGデータセットで評価したところ、SENSEはThought2Textのような完全微調整済みベースラインの生成品質に匹敵するか上回る一方で、計算オーバーヘッドを大幅に削減します。神経デコードを局所化し、導出されたテキスト手掛かりのみを共有することで、SENSEは次世代のBCIに向けた、拡張性が高くプライバシーに配慮したリトリーバル強化型アーキテクチャを提供します。