変分ニューロンの次元を探索する

arXiv cs.LG / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、明示的な事前分布、アモータライズド事後分布、およびユニットレベルの変分正則化を備えた変分分布ニューロンである EVE（Elemental Variational Expanse）を導入する。
この手法は確率的構造をニューロンレベルへ再配置し、ニューロンを局所的に観測・制御可能にする。グローバルな潜在変数に依存する従来の枠組みとは異なる。
研究は、ニューロンの潜在次元数 k（1 からより高次元へ）を変更した場合の挙動が、局所的な容量制御およびニューロンレベルの自己回帰拡張とどのように相互作用するかを検討し、有効 KL やドリフト指標といった診断指標で裏付ける。
予測タスクおよび表形式データのタスクを横断して、本研究はニューロンレベルの変数のうちいくつかが測定可能で、下流の挙動を予測することができると示しており、変分ニューロンの設計空間の初期的な地図を提供する。

要旨：私たちは EVE（Elemental Variational Expanse）を紹介します。局所的な確率計算ユニットとして定式化された分散ニューロンで、明示的な事前分布、アモルタイズド後方分布、およびユニットレベルの変分正則化を備えています。現代の多くのアーキテクチャでは、不確実性はグローバル潜在変数やパラメータ不確実性を通じてモデル化される一方、計算ユニット自体は依然としてスカラーのままです。これに対して EVE は確率的構造をニューロンレベルへ再配置し、局所的に観測可能で制御可能にします。
本論文では、次元という用語は主にニューロンの内部潜在次元性を指し、それは k で表されます。我々は k を、原子レベルのケース k = 1 から高次元の潜在空間へと変化させると、ニューロンが学習した作動モードがどのように変化するかを調べます。次に、この主軸が二つの追加的な構造特性、局所的な容量制御とニューロンレベルの自己回帰拡張による時間的持続性とどのように相互作用するかを検討します。
この研究を支えるため、EVE には内部診断と制約が組み込まれており、有効な KL、μ^2 に対するターゲットバンド、バンド外の分率、ドリフトと崩壊の指標などが含まれます。選択された予測および表形式設定全体において、潜在次元性、制御、および時間的拡張がニューロンの内部レジームを形作り、いくつかのニューロンレベルの変数は測定可能で有益であり、下流の挙動と関連していることを示します。総じて、本論文は、分散ニューロンによって開かれた設計空間の実験的根拠に基づく最初のマップを提供します。

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

日経XTECH

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

日経XTECH

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

日経XTECH

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

日経XTECH

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

日経XTECH

変分ニューロンの次元を探索する

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

ブームの裏で制御AI未導入54％、工場の自動化阻むコストと人材不足

光電融合の製造受託に野心、新光電気「TSMCにはない魅力を」

中国AI企業が他社製AIを「ただ乗り蒸留」か 米社が主張、安全保障リスクも

高1数学で理解できる機械学習、回帰直線のグラフ表示へ

AIで人月商売はもう終わり、人売りベンダーの技術者は速やかに逃げ出せ

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも