要約: 客観的な誤評価に基づく過小評価されたサッカー選手を特定する、実用的で再現可能なフレームワークを提示します。主観的な専門家のラベルに頼る代わりに、構造化データ(過去の市場ダイナミクス、経歷・契約属性、移籍履歴)から推定される予想市場価値を算出し、それを観測された評価額と比較して誤評価を定義します。次に、ニュース由来の自然言語処理(NLP)特徴量(すなわち、サッカー関連記事のセンチメント統計および意味表現)が、市場シグナルを補完して過小評価された選手のショートリスト作成に寄与するかを評価します。
時系列的(リークを考慮した)評価を用いると、勾配ブースティング回帰は対数変換された市場価値の分散の大部分を説明します。過小評価のショートリスト作成には、ROC-AUC に基づくアブレーションにより、市場ダイナミクスが主要なシグナルである一方、NLP特徴は一貫した二次的効果を提供し、頑健性と解釈性を向上させます。SHAP分析は、市場動向と年齢の支配性を示唆し、ニュース由来のボラティリティ指標が高い不確実性の領域でシグナルを増幅します。提案されたパイプラインは、スカウティングワークフローにおける意思決定支援を目的とし、厳密な分類閾値よりもランキング/ショートリスト作成を重視します。また、簡潔な再現性と倫理に関する声明を含みます。
市場動向とニュース信号を用いた過小評価サッカー選手のショートリスト化を目的とした客観的誤評価検出
arXiv cs.LG / 2026/3/19
📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research
要点
- 本論文は、構造化データから推定された予想市場価値を観測された評価額と比較することで、過小評価されたサッカー選手を特定する客観的な誤評価フレームワークを提案する。
- 市場動態、人物経歴と契約特徴、移籍履歴、サッカー関連記事からのNLP特徴を組み合わせて、ニュース信号がショートリストの頑健性を高めるかを評価する。
- 勾配ブースト回帰は、対数変換された市場価値の分散の大半を説明し、ROC-AUCのアブレーション分析では市場動態が主要な信号であることを示し、NLP特徴は副次的な寄与を提供する。
- SHAP分析は、市場動向と選手の年齢が予測を支配する一方、ニュース由来のボラティリティ指標は高不確実性の状況で有効であることを示している。
- 提案されたパイプラインは、スカウティングワークフローの意思決定支援を目的とし、厳格な閾値設定よりもランキング・ショートリスト化を強調し、再現性と倫理面の考慮を含む。




