要旨:ガウス型グラフィカルモデル(GGMs)は、高次元データ解析において変数間の相互作用を合成するために広く用いられている。ゲノミクスや画像解析など多くの応用では、グラフィカルモデルは次元削減と性能向上のために疎性(スパース性)とクラスタリングに依存する。本論文では、クラスタリングが知識に基づいて行われるのではなく、グラフ推論の課題と同時に実行される、やや異なるパラダイムを探究する。異なる粒度(グラニュラリティ)のレベルでグラフを提案することでネットワークの解釈可能性を高める、新しいマルチスケール・グラフィカル・ラッソ(MGLasso)を提案する。
本手法は、k-meansの緩和である凸クラスタリング手法と階層クラスタリングを通じてクラスタを推定する。さらに、無向グラフィカルモデルに対する近傍選択(ネイバーフッド選択)スキームにより、条件付き独立グラフを同時に推論する。MGLassoは、疎グループ化 fused lasso(疎グループ・ファストゥッド・ラッソ)問題を、無向グラフィカルモデルへ拡張し、一般化する。畳み込み閾値化(シュリンクエッジ・スレッショルディング)アルゴリズムにおいてNesterovのスムージングを伴う continuation を用いることで(CONESTA)、グループ fused Lasso ペナルティに沿った解の正則化パスを提案する一方、ラッソペナルティは一定に保つ。合成データに対する大規模な実験により、本モデルの性能を最先端のクラスタリング手法およびネットワーク推論モデルと比較する。腸内細菌叢データへの適用、ならびにポプラのメチル化データとトランスクリプトームデータの混合データへの適用も示す。
