minAction.net:エネルギーを優先するニューラル・アーキテクチャ設計—生物学的原理から体系的検証へ
arXiv cs.LG / 2026/4/29
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- この研究は、現代の機械学習が内部の計算エネルギーコストを明示的に考慮しない点を問題視し、2,203件の実験(視覚、テキスト、ニューロモーフィック、生理データ)でエネルギーを意識した学習を検証しています。
- 結果として、ニューラルネットのアーキテクチャ単体では精度のばらつきの説明力がほぼなく(partial eta² = 0.001)、一方でアーキテクチャ×データセットの相互作用が大きいことが示されました(partial eta² = 0.44、p < 0.001)。これはタスクのモダリティごとに最適アーキテクチャが変わり、「普遍的に最良なアーキテクチャ」という前提を否定するものです。
- 4桁にわたるlambdaの制御スイープにより、L = L_CE + lambda * E(θ, x) のエネルギー正則化損失が妥当化され、適度なlambdaで内部活性化エネルギーがベースラインの6%まで低下してもMNISTで精度が劣化しないことを示しています。
- 行為原理に基づくアクション・プライシプルから着想した「エネルギー優先」のアーキテクチャは、モダリティ内で従来のベースラインに対して学習効率を5〜33%改善します。
- 著者らは、古典力学のアクション汎関数、統計物理の自由エネルギー、変分推論におけるKL正則化目的関数の間の対応関係を、導出ではなく設計仮説として位置付けています。


