想像を見抜く：fMRIデータからの視覚イメージ復元における潜在機能整合

arXiv cs.AI / 2026/4/20

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本研究は、知覚用に訓練されたfMRI→視覚デコーダが、Imagery-NSDベンチマークの心的イメージを復元できるかを検証している。
提案手法は「潜在機能整合」であり、イメージにより喚起された脳活動を事前学習モデルの条件付け空間へ写像する一方、残りの構成要素は凍結する。
イメージと知覚の対応データが少ない課題に対して、NSDから意味的に関連する知覚試行を選ぶ検索ベースのデータ拡張を導入している。
4名の被験者で、凍結済み事前学習ベースラインおよびボクセル空間のリッジ整合ベースラインの双方に比べ、高次の意味再構成指標が一貫して改善することが示されている。
さらに、この結果は知覚から学習した意味構造が、分布外条件下でも視覚イメージ復元を安定化・向上させ、多数の皮質領域でチャンス以上の復号を可能にすることを示唆している。

要旨: fMRIからの視覚脳デコーディングにおける最近の進展は、自然画像データセット（NSD）のような大規模データセットや、強力な拡散ベースの生成モデルによって可能になってきました。現在のパイプラインは主に知覚のために最適化されていますが、心的イメージ（mental-imagery）に対する性能は、いまだ十分に理解されていません。本研究では、最先端（SOTA）の知覚デコーダ（DynaDiff）を、Imagery-NSDベンチマークからの想起内容の再構成にどのように適応できるかを検討します。我々は、残りの構成要素は凍結したまま、イメージが喚起した活動を、事前学習済みモデルの条件付け空間へと写像する、潜在機能アラインメント（latent functional alignment）アプローチを提案します。対応するイメージ—知覚の教師データ量が限られていることへの対策として、セマンティックに関連するNSDの知覚試行を選択する、検索ベースのデータ拡張戦略もさらに導入します。4名の被験者において、潜在機能アラインメントは、凍結された事前学習ベースラインおよびボクセル空間リッジ・アラインメント基準に比べて、高レベルの意味論的再構成指標を一貫して改善し、複数の皮質領域からチャンスを超えるデコーディングを可能にしました。これらの結果は、知覚から学習された意味構造を、分布外条件下における視覚的イメージングのデコーディングを安定化し、向上させるために活用できることを示唆しています。

M5 Pro 24GBでQwen 3.6を動かすならどのバージョン（量子化）？

Reddit r/LocalLLaMA

理論から現実へ：なぜAIエージェントのプロジェクトの多くが失敗するのか（そして自分もそうだった）

Dev.to

GPT-5.4-Cyber：AIセキュリティとディフェンシブAIのためのOpenAIの画期的提案

Dev.to

デジタル・ソウルを作る：あなたを誰よりも理解するAIを作る残酷な現実

Dev.to

ローカルLLM入門ガイド（Mac - Appleシリコン）

Reddit r/artificial

想像を見抜く：fMRIデータからの視覚イメージ復元における潜在機能整合

要点

関連記事

M5 Pro 24GBでQwen 3.6を動かすならどのバージョン（量子化）？

理論から現実へ：なぜAIエージェントのプロジェクトの多くが失敗するのか（そして自分もそうだった）

GPT-5.4-Cyber：AIセキュリティとディフェンシブAIのためのOpenAIの画期的提案

デジタル・ソウルを作る：あなたを誰よりも理解するAIを作る残酷な現実

ローカルLLM入門ガイド（Mac - Appleシリコン）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer