Kolmogorov-Arnoldネットワークのための最適化されたアーキテクチャ

arXiv stat.ML / 2026/4/22

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来の改善が複雑さを増やして解釈可能性を損なっていた問題を踏まえ、解釈可能性を維持しつつKAN(Kolmogorov-Arnoldネットワーク)を改良する建築的方策を提案しています。
  • 過剰に用意したアーキテクチャに、スパーシフィケーション(疎化)、深い監督、深さ選択を組み合わせることで、精度を落とさずにコンパクトで解釈可能なKANを学習することを検討します。
  • 最小記述長(MDL)目的のもとで、活性化・構造・深さをエンドツーエンドで同時に最適化する、微分可能な仕組みを採用しています。
  • 実験は関数近似、力学系の予測、実世界の予測タスクなどで行われ、疎化だけでは不十分だが、深さ選択を加えることでより小さなモデルを発見しつつ競争力のある、あるいは優れた精度が得られることを示しています。

概要: 建築上の改良によってコルモゴロフ—アーノルド・ネットワーク(KAN)を改善しようとする取り組みは、それらの改良がもたらす複雑さによって阻まれ、その結果、そもそもKANが魅力的である理由である解釈可能性が損なわれてきました。ここでは、過剰に用意されたアーキテクチャと、疎化(sparsification)、深い監督(deep supervision)、深さ選択(depth selection)を組み合わせることで、精度を犠牲にすることなく、コンパクトで解釈可能なKANを学習することを研究します。重要なのは、原理に基づく最小記述長(minimum description length)目的のもとで、微分可能な仕組みに焦点を当て、活性化、構造、深さをエンドツーエンドで共同最適化する点です。関数近似ベンチマーク、力学系の予測、実世界の予測タスクにまたがる実験により、疎化だけでは不十分である一方、深さ選択との組み合わせによって、より小さなモデルを実質的に発見しつつ、競争力のある、あるいはそれを上回る精度が達成できることが示されます。この結果は、より高い表現力とより高い解釈可能性を兼ね備えたモデルに向けた、原理に基づく道筋を提供し、科学的機械学習における重要な緊張関係に対処します。