要旨: エンコーディングモデルは、連続的な刺激の特徴と神経活動を結びつけるための強力な枠組みを提供します。しかし、従来のボクセルごとのアプローチは、計測ノイズ、被験者間のばらつき、そして空間的に相関のあるボクセルが重なり合う神経信号を符号化することに起因する冗長性によって制限されます。ここでは、fMRIデータにおいて刺激駆動信号とノイズ駆動信号を切り離す独立成分(IC)ベースのエンコーディング枠組みを提案します。自然な物語の聴取を行う際の連続的なfMRIデータを、一つのデータ部分集合を用いてICへ分解し、大規模言語モデルによる言語入力の表象から、独立データ上で学習したエンコーディングモデルによってICの時系列を予測します。被験者間で、一部のICは一貫して高い予測性を示しました。これらのICは、被験者間で空間的・時間的に一貫しており、物語聴取中に応答することが知られた認知ネットワーク(聴覚および言語)を含んでいました。聴覚成分の時系列は音響刺激特徴と強く相関しており、同定された成分時系列の解釈可能性が際立ちました。ICA-AROMAによってノイズまたは運動(モーション)関連アーチファクトとして同定された成分は、予測性能が一様に低く、強く予測された成分が、混同要因(コンファウンド)ではなく、真に刺激関連の神経信号を反映していることを確認します。全体として、ICベースのエンコーディングモデルは、機能的ネットワークのレベルでの解析を可能にし、個人間でネットワークの位置が変動することに対応しつつ、被験者間で比較しやすい解釈可能な結果を提供します。
物語理解中の脳活動を対象とした独立成分(IC)ベースのエンコーディングモデル
arXiv cs.CL / 2026/4/29
📰 ニュースModels & Research
要点
- 本研究は、fMRIデータにおいて刺激に由来する信号とノイズ由来の信号を切り分ける独立成分(IC)ベースのエンコーディング手法を提案しています。
- 物語のリスニング課題で得た連続fMRIデータをICに分解し、言語入力を表す大規模言語モデル(LLM)の表現からIC時系列を予測するエンコーディングモデルを独立データで学習します。
- 被験者間で予測精度が一貫して高いICの一部が見つかり、それらは空間的・時間的に整合的で、物語理解に関連する認知ネットワーク(聴覚と言語)を含むことが示されました。
- 聴覚成分の主要な時間系列は音響特徴と強く相関し、同定された成分の解釈可能性が高まる一方で、ICA-AROMAでノイズや動き由来のアーティファクトと判定された成分は予測性能が一様に低いことが確認されています。
- 全体として、このアプローチは機能的ネットワークのレベルで分析を可能にし、個人間でネットワーク位置が変動する問題にも対応しつつ、被験者間で比較しやすい解釈可能な結果を提供します。



