分子表現としての高次元フィンガープリント(Hyper-Dimensional Fingerprints)
arXiv cs.LG / 2026/5/1
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- この論文では、学習を必要とせず高次元ベクトルに対する代数的操作で分子表現を行う、決定論的な分子フィンガープリント「HDF」を提案している。
- 複数の性質予測ベンチマークで、HDFは従来のハッシュ化フィンガープリントに対して概ね優れ、データセットやモデル間での一貫性も高い。
- HDF埋め込みは、標準的なMorganフィンガープリントよりも分子の構造的類似性をより忠実に保持し、低次元でもグラフ編集距離との相関が高い。
- 64コンポーネント程度という少数次元でも、ハッシュベース手法が劣化する領域で、最近傍回帰が予測性を維持できることを示している。
- ベイズ分子最適化では、HDFベースのサロゲートモデルが、Morganフィンガープリントがランダム探索と同程度にとどまる条件下でサンプル効率を大幅に改善することを実証している。




