概要: カウントデータから潜在構造を回復することは、ネットワーク推定において大きな注目を集めています。特に、二部グラフにおいて、グループ間の相互作用とグループ内の類似性パターンの両方を求めたい場合に広く用いられ、生態学の研究で頻繁に利用されています。こうしたネットワークはしばしば疎であり、検出には本質的に不完全性があります。既存のモデルは主に相互作用の回復に焦点を当てている一方で、誘導される類似性グラフはあまり研究されていません。さらに、疎性がしばしば制御されておらず、スケールのバランスも崩れているため、過度に疎な、あるいは十分に再スケーリングされていない推定値となり、構造回復が劣化します。これらの課題に対処するため、検出確率の推定を伴う、構造化された疎な非負の低ランク因子分解のための枠組みを提案します。我々は、潜在の類似性および接続性の構造に対して非凸な 正則化を課し、グループ内の類似性とグループ間の接続性に対して疎性を促すとともに、より良い相対スケールを実現します。その結果得られる最適化問題は非凸で非滑らかです。これを解くために、適応的なペナルティ付けとスケールを意識した初期化を備えたADMMベースのアルゴリズムを開発し、穏やかな正則性条件の下で、クラスタ点の漸近的な実現可能性とKKT停留性を示します。合成データおよび実データの生態学的データセットに対する実験により、既存のベースラインと比較して、潜在因子ならびに類似性/接続性構造の回復が改善されることが示されました。
1/2
不完全な検出下でのスパース・ネットワーク推論と生態学的ネットワークへの応用
arXiv stat.ML / 2026/4/22
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は、カウントデータから二部ネットワークにおける潜在構造を復元することに焦点を当て、グループ間の相互作用とグループ内の類似性パターンの両方を、不完全な検出のもとで扱います。
- 既存モデルは主に相互作用の復元に注力している一方で、そこから暗に得られる類似性グラフはあまり研究されていないこと、またスパース性の制御不足やスケールの不均衡が過度なスパース化や不適切な再スケーリングにつながり構造復元を劣化させることを指摘しています。
- 検出確率を推定する枠組みとして、構造化されたスパースな非負低ランク因子分解を提案し、潜在の類似性と接続構造に非凸のℓ1/2正則化を課すことで、類似性と接続の両方で相対的に良いスケールのスパース性を促します。
- 解法として、適応的ペナルティとスケールを意識した初期化を用いるADMMベースのアルゴリズムを開発し、漸近的な実現可能性およびKKT停留点に関する理論保証を(穏当な正則性条件のもとで)示します。
- 合成データと実在の生態学データでの実験により、既存ベースラインに比べて潜在因子の復元に加え、類似性・接続構造の復元が改善することを示しています。



