要旨: 表形式データに対する生存分析は、よく研究された問題です。しかし、既存の深層学習手法はしばしばタスク固有性が高く、そのため他分野からの新しいアプローチの移植が制限されたり、性能に影響し得る制約が導入されたりします。本稿では、Weibull分布または非パラメトリックな生存予測のいずれかを用いて、生存分析のために現代的な表形式アーキテクチャを適応させる手法TabSurvを提案します。TabSurvは、打ち切りデータをサポートする新しいヒストグラム損失関数であるSurvHLを最適化します。基礎となるフィードフォワードネットワークに加えて、TabSurvの中で生存分析のためのMLPの深いアンサンブルを実装します。先行研究とは対照的に、アンサンブル構成要素は並列に学習され、平均化の前に生存分布パラメータを最適化します。これにより、アンサンブル構成要素の予測間の多様性が促進されます。多様な実世界の生存データセット10個に対して、提案するさまざまなアーキテクチャについて包括的な実証評価を行います。その結果、TabSurvは、RSF、DeepSurv、DeepHit、SurvTRACEといった既存の古典的および深層学習のベースラインに対して、平均で一貫して優れた性能を示すことが分かりました。とりわけ、非パラメトリックなモデルの代わりにWeibullのパラメトリゼーションを用いた深いアンサンブルは、C-indexにおける平均順位が最も高いことを示します。全体として、本研究は、生存分析の問題に取り組むために現代的な表形式ニューラルネットワークをどのように適応させ、学習できるかを明確にし、強力で信頼性の高いアプローチを提供します。TabSurvの実装は公開されています。
TabSurv:生存分析のための現代的な表形式ニューラルネットワークの適応
arXiv stat.ML / 2026/5/6
💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research
要点
- 本論文は、Weibull分布によるモデリング、または非パラメトリックな生存予測のいずれかを用いて、生存分析向けに現代的な表形式ニューラルネットワークを適応する手法TabSurvを提案する。
- TabSurvは、打ち切りデータに対応するために設計された新しいヒストグラム型の損失関数SurvHLを用いて学習する。
- 基本となるフィードフォワードモデルに加え、MLPの深いアンサンブルも導入し、アンサンブル成分を並列に学習して多様性を高めたうえで平均化する。
- 10種類の多様な実データの生存データセットに対する包括的な評価により、TabSurvはRSF、DeepSurv、DeepHit、SurvTRACEといった既存の古典手法および深層学習ベースラインに比べて平均的に一貫して優れることが示される。
- 非パラメトリックモデルよりもWeibullパラメータ化を用いる深いアンサンブルの方が、C-indexの平均順位が最も高くなることが報告され、実装も公開されている。




