過分散潜在モデリングのための負の二項変分オートエンコーダ

arXiv stat.ML / 2026/4/9

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ポアソン分布の「平均—分散の固定的な仮定」ではなく分散パラメータを用いて過分散なスパイク計数データをモデル化するための、負の二項変分オートエンコーダ「NegBio-VAE」を提案する。
  • 離散的な計数ベースの潜在変数を用いることで、生物学的妥当性および表現力(表現の柔軟性)を高めつつ、潜在変数モデルに典型的な解釈可能性を維持することを目的とする。
  • 著者らは、負の二項の潜在変数定式化に対して学習を実行可能かつ安定にするため、新しいKLダイバージェンス推定およびリパラメータ化(再パラメータ化)の手法を提案する。
  • 4つのデータセットにわたる実験により、NegBio-VAEが、競合する単層VAEのベースラインよりも再構成および生成性能で優れていることが示され、さらに下流タスクにおいてより有益な潜在表現を生成することが確認される。
  • 大規模なアブレーション研究により、主要コンポーネントの頑健性と性能向上への寄与が検証される。

Abstract

人工ニューラルネットワークはしばしば脳に着想を得たものだと説明されますが、その表現は通常、連続的な活性化、たとえば変分オートエンコーダ(VAE)における連続的な潜在変数に依存しています。そのため、実在のニューロンにおける離散的なスパイクベースの信号伝達と比べると、生物学的妥当性が制限されます。Poisson VAE のような拡張では離散のカウントに基づく潜在変数が導入されますが、平均と分散が等しいという仮定は、ニューラルスパイクの過分散(overdispersion)を捉えられず、表現力および情報量の点で劣った表現となります。そこで本研究では、スパイク数を柔軟にモデリングするための分散パラメータを備えた負の二項分布の潜在変数モデルである NegBio-VAE を提案します。NegBio-VAE は解釈可能性を維持しつつ、新しい KL 推定と再パラメータ化により、表現品質と学習の実現可能性を向上させます。4つのデータセットでの実験により、NegBio-VAE は、競合する単層 VAE のベースラインと比べて、常に再構成および生成の性能が優れていることを示します。また、下流タスクに対して堅牢で有益な潜在表現をもたらします。モデルの頑健性について、さまざまな構成要素に関して検証するために、広範なアブレーション研究を実施します。コードは https://github.com/co234/NegBio-VAE で公開しています。