広告

DNA配列分類のためのボルツマン機強化トランスフォーマー

arXiv cs.AI / 2026/3/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、DNA配列分類のために「ボルツマン機強化(Boltzmann-machine-enhanced)」トランスフォーマーを提案し、標準的なソフトマックス注意よりも潜在的な部位間相互作用、組合せ的な調節、そしてエピスタシス様の高次依存をより適切に捉えることを目指している。
  • 連続的なソフトマックス注意を置き換える/補う形で、ボルツマン型のエネルギー関数によって制約された、構造化された二値のクエリ―キー・ゲーティング変数を導入し、ペアワイズおよび高次の相互作用のモデリングを可能にする。
  • 離散的なゲーティング・グラフに対する事後推論は計算困難であるため、本手法では平均場変分推論によりエッジ活性化確率を推定し、Gumbel-Softmaxを用いて連続推定値を徐々にほぼ離散的なゲートへと近づける。
  • 学習は、分類損失とエネルギー損失を同時に最適化し、予測精度に加えて「低エネルギー」で安定し、より解釈しやすい構造を促す。さらに著者らは、変分自由エネルギーと平均場の固定点から最終目的関数を導出している。
  • 全体として、本研究はボルツマン機、微分可能な離散最適化、そしてトランスフォーマーを組み合わせて、生物学的配列データに対する構造化学習を行うための統一的枠組みを提示する。

要旨: DNA配列の分類には、高い予測精度だけでなく、潜在的な部位間相互作用、組合せ的制御、およびエピスタシス様の高次依存性を明らかにする能力が必要である。標準的なTransformerは強力な大域的モデリング能力を提供するものの、そのsoftmaxによる注意は連続的で密であり、また弱く制約されているため、明示的な構造発見というよりは情報ルーティングにより適している。本論文では、DNA配列分類のためのボルツマンマシン強化Transformerを提案する。マルチヘッド注意に基づき、このモデルは潜在的なクエリ—キー接続を表すための、構造化された二値ゲーティング変数を導入し、それらをボルツマン様のエネルギー関数で制約する。クエリ—キーの類似度が局所的なバイアスタームを定義し、学習可能な対(ペア)間相互作用がエッジ同士の相乗効果と競合を捉え、潜在的な隠れユニットが高次の組合せ的依存性をモデル化する。離散的なゲーティンググラフに対する厳密な事後推論は計算不能であるため、平均場変分推論を用いてエッジの活性化確率を推定し、さらにGumbel-Softmaxと組み合わせることで、連続確率を近似的に離散的なゲートへと段階的に圧縮しつつ、エンドツーエンドの微分可能性を維持する。学習時には、分類損失とエネルギー損失を同時に最適化し、低エネルギーで安定かつ解釈可能な構造を好みながら、正確な予測を達成することを促す。さらに、エネルギー関数および変分自由エネルギーから、本枠組みを平均場固定点方程式、Gumbel-Softmaxの緩和、および最終的な共同目的関数へと導出する。提案する枠組みは、ボルツマンマシン、微分可能な離散最適化、ならびにTransformerを、生物学的配列に対する構造化学習として統合するための統一的な見方を提供する。

広告