要旨: スポーツ分析は、コーチングの意思決定に役立つ実行可能なデータを提供し、選手のパフォーマンスを向上させ、チーム戦略を強化できるため、チームのパフォーマンスにとって重要です。試合映像からより複雑な特徴を分析するためには、コンピュータビジョンモデルを用いてピッチ上の主要な対象を識別し、追跡することができます。そこで本研究では、試合を通して選手の位置を予測するための、物体検出および追跡システムの利用を提案します。これをピッチ寸法に関する位置へと変換するために、点予測モデルを用いてピッチ上の重要な点を特定し、既知のピッチ寸法と組み合わせることで実際の距離を抽出します。選手識別モデルについては、YOLO や Faster R-CNN のような物体検出モデルを、複数の異なる評価指標を用いて、我々のカスタム動画映像における精度について評価します。目的は、セグメンテーションおよび追跡のために SAM2(Segment Anything Model 2)と組み合わせた際に、最も正確な結果を得るための、物体識別に最適なモデルを特定することです。重要点検出モデルについては、CNNモデルを用いてサッカー場で一貫した位置を見つけます。ホモグラフィによって、カメラ視点における点や対象の位置は、実地(real-ground)の視点へと変換されます。SAM2 から得られたセグメント済みの選手マスクは、カメラの角度や移動にかかわらず、ホモグラフィによってカメラ視点から実世界のピッチ座標へ変換されます。変換された実世界座標は、選手のスピード、移動距離、ポジショニングのヒートマップ、さらに複雑なチーム指標など、価値ある戦術的洞察を計算するのに利用できます。これにより、標準的な動画分析ではこれまで得られなかった、実行可能なパフォーマンスデータをコーチや選手に提供します。
コンピュータビジョンによるAI駆動のサッカー分析
arXiv cs.AI / 2026/4/13
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、試合映像からコンピュータビジョンを用いて選手を検出・追跡するAI駆動のサッカー分析パイプラインを提案し、コーチングおよびパフォーマンスの洞察を得ることを目的とする。
- 物体検出モデル(YOLOやFaster R-CNNを含む)をカスタムの動画映像で評価し、下流のセグメンテーション/トラッキングの前に、最も正確に選手を識別できる手法を特定する。
- カメラ視点での計測値を実フィールドの座標へ変換するために、このアプローチでは、CNNによるキーポイント検出とホモグラフィを組み合わせてフィールドの幾何を推定し、実距離を算出する。
- セグメンテーションとトラッキングにはSAM2を統合し、その後、セグメント化した選手マスクを実世界のフィールド座標へ変換することで、移動速度、移動距離、ポジショニングのヒートマップといった戦術的な出力を生成する。




