要旨: 質量分析法(MS)は分子同定の基幹となる分析技術であるが、スペクトルからのデノボ構造解明は、化学空間の組み合わせ的な複雑さとスペクトルフラグメンテーションパターンの固有のあいまいさのため、依然として困難である。最近の深層学習アプローチには、自己回帰系列モデル、スキャフォールドベースの手法、グラフ拡散モデルなどを含む進展が見られる。しかし、このタスクの拡散ベース生成は計算コストが高い。一方、グラフ生成に対して高い性能を示してきた離散フロー整合は、スペクトル条件付きの構造解明にはまだ検討されていなかった。本研究では FlowMS を紹介する。FlowMS は、スペクトル条件付きのデノボ分子生成のための初の離散フロー整合フレームワークである。FlowMS は、確率空間における反復的な洗練を通じて分子グラフを生成し、化学式の制約を課すとともに、事前学習済みの式トランスフォーマーエンコーダからのスペクトル埋め込みを条件として用いる。特筆すべきは、NPLIB1 ベンチマークの 6 指標のうち 5 指標で最先端の性能を達成しており、9.15% のトップ1精度(DiffMS に対する相対的改善 9.7% )および 7.96 のトップ10 MCES(MS-BART に対する改善 4.2% )を達成している。生成された分子を可視化することも行い、FlowMS が構造的にもっともらしい候補を正解の構造に密接に似せて生成することを示している。これらの結果は、メタボロミクスおよび天然物探索における質量分析ベースの構造解明における有望なパラダイムとして、離散フロー整合を位置づける。
FlowMS:質量スペクトルからのデノボ構造解明の離散型フローマッチング
arXiv cs.LG / 2026/3/20
📰 ニュースModels & Research
要点
- FlowMSは、スペクトル条件付きのデノボ分子生成を目的とした、初の離散型フローマッチングフレームワークとして提案される。
- 化学式制約を課しつつ確率空間で反復的な精緻化を行い、事前訓練済みの化学式トランスフォーマーエンコーダからのスペクトル埋め込みを使用する。
- NPLIB1ベンチマークの6指標中5指標で最先端の性能を達成し、トップ1精度は9.15%(DiffMSに対して相対改善9.7%)、トップ10 MCESは7.96(MS-BARTに対して4.2%の改善)を含む。
- 視覚的分析により、生成された分子は構造的に妥当であり、真値構造に密接に類似していることが示されている。
- 本研究は離散フローマッチングを、MSベースの構造解明の有望なパラダイムとして位置づけ、拡散ベースのアプローチが抱える計算負荷に対処する。
関連記事

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す
THE DECODER
Kreuzberg v4.5.0: Doclingのモデルをとても気に入ったので、より高速なエンジンを搭載しました
Reddit r/LocalLLaMA
今日は、qwen 120B のような比較的大きめのローカルモデルを動かすには、どんなハードウェアを用意すべきか?
Reddit r/LocalLLaMA
会議ノート作成のためにMistralをローカルで実行することは、私の用途には正直十分だ
Reddit r/LocalLLaMA
[D] 5つの年代にわたる単一アーティストの長期的ファインアートデータセットがHugging Faceに公開 — スタイルの進化、人物表現、倫理的トレーニングデータの潜在的応用
Reddit r/MachineLearning