要旨: DNA配列の解析は、進化生物学から遺伝子制御や疾患メカニズムの理解に至るまで、多くの分野で重要になっています。深いニューラルネットワークは驚異的な予測性能を達成できますが、通常はブラックボックスとして動作します。これらのブラックボックスとは対照的に、軸に整列した決定木は解釈可能なDNA配列解析に向けた有望な方向性を提供しますが、根本的な制約があります。つまり、各分岐において個々の生の特徴量を単独で考慮すると表現力が制限され、その結果、解釈可能性と汎化性能の両方を妨げるほどの過度に深い木になってしまいます。私たちは、この課題に対処するために、樹木構築の過程で高レベルの配列特徴を適応的に生成する新しい枠組みDEFTを提案します。DEFTは大規模言語モデルを活用し、各ノードにおける局所的な配列分布に合わせて、生物学的に裏付けられた特徴量を提案し、それらを反省(リフレクション)メカニズムによって反復的に洗練します。実験的に、DEFTが幅広いゲノム課題にわたって、人が解釈できる高い予測力を持つ配列特徴を発見できることを示します。
決定木における動的特徴生成による解釈可能なDNA配列分類
arXiv cs.AI / 2026/4/15
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、深層ニューラルネットワークがDNA配列の予測に優れている一方で、しばしばブラックボックスであることを指摘し、軸に沿った決定木のようなより解釈可能な手法の必要性を動機づけている。
- 標準的な決定木の分割における重要な制限、すなわち各ノードで生の特徴を独立に扱うことにより、解釈可能性を損なうほど深い木になり、さらに汎化性能にも悪影響が出る点を明らかにしている。
- 提案するDEFTフレームワークは、生の入力のみに依存するのではなく、決定木の構築過程で生物学的に示唆されたより高次の配列特徴を適応的に生成する。
- DEFTは、大規模言語モデルを用いて各ノードにおける局所的な配列分布にもとづき候補特徴を提案し、その後、リフレクション(反省)メカニズムによりそれらを反復的に洗練させる。
- 複数のゲノム課題に対する実験により、DEFTが強い予測性能を維持しつつ、人が解釈できる特徴を生成できることが示されている。



