相関係数27位 → Random Forest 1位。その原因は「95本中たった1本のラップ」だった
Qiita / 2026/5/2
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- レーシングシミュレータの実データを題材に、データサイエンス概念(特徴量スクリーニング)をPythonで実装しながら解説している。
- 相関係数による順位では上位に来ていない特徴量でも、Random Forestの重要度評価では1位になる例が示される。
- その差の原因は、全95本のラップのうち「たった1本のラップ」に強く依存する特徴量的挙動(=局所的に効くパターン)にあると説明されている。
- 相関係数とRandom Forestでは、捉える関係(線形/単調性・非線形性、局所性など)が異なるため、特徴量選定の結果が大きく変わり得る点を強調している。
レーシングシミュレータの実データを使って、データサイエンスの概念を実装とともに解説しています。
この記事では 特徴量スクリーニング(相関係数とRandom Forestの比較)を扱います。
こんな人に役立ちます
相関係数とRandom Forest の特徴量重要度がなぜ...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →



