AI Navigate

金融ローンデフォルト予測のための最適化された貪欲重み付けアンサンブルフレームワーク

arXiv cs.LG / 2026/3/20

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、実証的な予測性能に基づいてモデルの重みを適応的に割り当てる、ローンデフォルト予測用の最適化された貪欲重み付けアンサンブルフレームワークを提案する。
  • それは、粒子群最適化(Particle Swarm Optimisation)によりハイパーパラメータが最適化された複数の機械学習分類器を組み合わせ、正則化された貪欲重み付け手法を用いて出力を統合する。
  • スタック型アンサンブル内でニューラルネットワークを用いたメタ学習モデルを採用し、モデル予測間の高次の関係を捉える。
  • Lending Clubデータセットにおいて、BlendNetアンサンブルはAUCを0.80、マクロF1スコアを0.73、デフォルト再現率を0.81で達成し、較正分析は木ベースのアンサンブルが信頼性の高い確率推定を提供する一方、スタック型アンサンブルは強いランキング能力を示すことを示している。
  • 再帰的特徴選択法(RFE)は、リボルビング利用率、年収、および負債対所得比率をローンデフォルトの主要な予測因子として特定し、解釈可能で性能重視の信用リスクモデリングを示している。

要旨:
貸出デフォルトの正確な予測は、非線形の関係、クラス不均衡、および進化する借り手の行動によって特徴づけられる現代の金融データセットにおいて、クレジットリスク管理の中心的な課題である。
従来の統計モデルや静的なアンサンブル手法は、このような状況下で信頼性の高い性能を維持することがしばしば難しい。
本研究は、実証的予測性能に基づいてモデルの重みを動的に割り当てる、ローンデフォルト予測のための最適化された貪欲重み付けアンサンブルフレームワークを提案する。
このフレームワークは複数の機械学習分類器を統合し、それらのハイパーパラメータをまず粒子群最適化(PSO)を用いて最適化する。
その後、モデルの予測は正則化された貪欲重み付け機構を介して結合される。
同時に、スタックド・アンサンブル内でニューラルネットワークベースのメタ学習器を用いて、モデル出力間のより高度な関係を捉える。
Lending Clubデータセットを用いた実験は、提案されたフレームワークが個別の分類器に比べて予測性能を改善することを示した。
BlendNetアンサンブルは最も強い結果を示し、AUCが0.80、マクロ平均F1スコアが0.73、デフォルトリコールが0.81であった。
キャリブレーション分析は、Extra TreesやGradient Boostingなどの木ベースのアンサンブルが最も信頼性の高い確率推定を提供する一方、スタックド・アンサンブルは優れた順位付け能力を提供することを示している。
Recursive Feature Eliminationを用いた特徴量分析は、リボルビング利用率、年収、および債務所得比率をローンデフォルトの最も影響力のある予測因子として特定する。
これらの知見は、性能重視のアンサンブル重み付けが、クレジットリスクモデリングにおける予測精度と解釈可能性の双方を向上させることを示しています。
提案されたフレームワークは、機関の信用評価、リスク監視、財務意思決定を支援するスケーラブルなデータ駆動型アプローチを提供します。