Abstract
生物学的に妥当な新規の3次元形態構造を生成することは、計算進化生物学における根本的な課題である。しかし、極端なデータ不足と、生成される形状が種間の系統関係(フィロゲネティックな関係)を尊重する必要があることにより、この課題は阻まれている。本研究では、2つの革新を統合した、系統に条件付けられた3D生物形態のためのニューラル生成モデル PhyloSDF を提案する:(1)進化距離と相関するように潜在空間を構造化する新規の 系統整合性ロス(Phylogenetic Consistency Loss)によって正則化された DeepSDF オートデコーダ(Pearson r=0.993);(2)生成を、解析的な種セントロイド(種の中心)ルックアップと、学習された残差予測に因数分解する Residual Conditional Flow Matching(Residual CFM)アーキテクチャ。これにより、種あたり~4標本という少数からでも生成が可能になる。PhyloSDF は、ダーウィンのフィンチとその近縁種の24種にわたる、100枚のマイクロCTスキャンした頭蓋骨で評価する。モデルはコードレベルで実際の種内変動の88-129%に到達する新規メッシュを生成し、生成された180枚すべてが「記憶に基づく(memorized)」ものではないことが検証される。Residual CFM は、(この規模では完全に失敗する)ノイズ除去拡散(denoising diffusion)、(モード崩壊して)3-6%の変動に収束してしまう標準的なフローマッチング(standard flow matching)、およびガウス混合モデルのベースラインのいずれも、忠実度(Chamfer 距離 0.00181 vs. 0.00190)と形態計測 Fr\'{e}chet 距離(10,641 vs. 13,322)の両方で上回る。18種に対する「1種を除く」実験では、系統的な外挿能力が示され、滑らかな潜在表現の補間は、生物学的に妥当な祖先の頭蓋骨再構成を生成する。