エントロピー最適輸送に基づくモデルベースクラスタリング

arXiv stat.ML / 2026/5/6

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • この論文では、ログ尤度を最適化するモデルベースクラスタリングの枠組みを、エントロピー最適輸送(EOT)に基づく損失関数へ置き換える新しい手法を提案しています。
  • EOT損失は元のログ尤度目的と同じ大域的最適解を持ちながら、最適化の地形(ランドスケープ)がより扱いやすい形になると主張しています。
  • ログ尤度は非凸で局所最適に陥りやすいため、新手法は多重な初期化(複数回の初期値設定)の必要性を減らすことを狙っています。
  • EOT損失の最適化にはSinkhorn-EMアルゴリズムを導入し、標準のEMと同等に近い収束率を示したとしています。
  • 大規模な数値実験と実世界の2つの適用例(C. elegans顕微鏡における画像セグメンテーション、空間トランスクリプトミクスのクラスタリング)により、EOTベース手法がログ尤度最適化より優れることを報告しています。

要旨: モデルに基づくクラスタリングのための新しい手法を開発します。対数尤度を最適化することで、クラスタリングのための原理的な統計的枠組みが得られ、解はEMアルゴリズムによって見つけられます。しかし、対数尤度は非凸であるため、停留点への収束しか保証できず、実務者はしばしば、どれかが大域解に収束することを期待して複数の初期値を用います。そこで、エントロピー的最適輸送に基づく新しい損失関数を考えます。この損失関数は対数尤度と同じ大域最適解を共有しますが、はるかに挙動の良い(扱いやすい)地形を持つため、対数尤度で広く見られる、見かけの局所最適に対応する構成を避けることができます。対数尤度に対するEMアルゴリズムと同様に、この新しい損失はSinkhorn-EMアルゴリズムによって最適化できることを示し、収束率がEMと同程度であることを証明します。大規模な数値実験と、C. elegansの顕微鏡画像における画像セグメンテーションおよび空間トランスクリプトミクスにおけるクラスタリングという2つの実世界の応用を分析することで、この新しい損失が対数尤度の最適化を上回ることを示し、実務者にとって価値あるクラスタリング手法を表すことを示します。