要旨: 潜在拡散モデル(LDM)は高忠実度の合成を実現しますが、潜在空間の脆さに悩まされており、編集中に意味が不連続に跳躍します。私たちは生成ヤコビアンを解析することで、この不安定性を診断するためのリーマン幾何学的枠組みを導入します。幾何を extit{Local Scaling(局所スケーリング)}(容量)と extit{Local Complexity(局所複雑性)}(曲率)に分解します。本研究は、 extbf{``Geometric Decoupling(幾何学的デカップリング)
幾何学的デカップリング:潜在表現の構造的不安定性を診断する
arXiv cs.AI / 2026/4/22
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、潜在拡散モデル(LDM)が「潜在空間の脆さ」を持つため、画像編集時に意味が不連続にジャンプする問題が起きると主張している。
- 著者らは、生成ヤコビアンを解析して、影響をローカルスケーリング(能力)とローカルコンプレキシティ(曲率)に分解する、リーマン幾何学に基づく診断手法を提案している。
- 研究では「幾何学的デカップリング」と呼ばれる現象を見出しており、分布外(OOD)生成では極端な曲率が知覚できる細部ではなく、不安定な意味境界に費やされてしまうことを示している。
- さらに「幾何学的ホットスポット」を不安定性の構造的な原因として特定し、生成信頼性をより頑健に診断するための固有の幾何学的指標を提案している。


