自動運転シャトルが存在する共有空間における視線情報を用いた文脈認識型歩行者軌道予測:仮想現実研究

arXiv cs.LG / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、異なる接近角度と連続的な交通状況における共有型都市空間で歩行者が自動運転シャトルとどのように相互作用するかを示すVR研究を提示する。
  • 歩行者の軌道、微細な視線ダイナミクス、および文脈的要因を融合して歩行者の行動を予測する、マルチモーダルモデルのGazeX-LSTMを紹介する。
  • 結果は、視線情報が頭部の向きだけよりも予測力を提供し、文脈情報と組み合わせると予測精度が超加算的に向上することを示している。
  • この知見は、複雑な共有空間においてより安全で適応的な自動運転車技術を実現するために、視線情報を組み込み、文脈を考慮したモデリングの必要性を提唱している。

要旨: 交通ルールが存在しないことと複雑な歩行者の相互作用により、共有都市空間に自動運転シャトルを統合することは、特有の課題を呈します。これには、さまざまな接近角度や連続した交通の中での移動を含みます。
このような非構造化された環境で歩行者の挙動を正確に予測することは、安全性と効率の双方を確保するために極めて重要です。
本論文は、さまざまなシナリオにおける歩行者と自動運転シャトルの相互作用を捉える仮想現実(VR)研究を提示します。これには、接近角の変化や連続した交通の中での移動を含みます。
共有空間における歩行者の意思決定に現れる重要な行動パターンを特定します。躊躇、回避動作、視線配分、距離感の調整を含みます。
歩行者の挙動をモデル化するために、視線情報と文脈を取り入れた多モーダル予測モデルであるGazeX-LSTMを提案します。これは歩行者の軌道、細粒度の視線ダイナミクス、および文脈要因を統合します。
視線追跡データを用いて歩行者の注意を捉え、予測を車両中心の視点から人間中心の視点へと転換します。
視線が頭部の向きだけを用いる予測力よりも独自で不可欠な予測力を有することを系統的に検証し、文脈変数を統合することで性能をさらに高めます。
特に、視線データと文脈情報を組み合わせると、歩行者の挙動予測精度が超加法的に改善され、視覚的注意と状況文脈の補完関係が明らかになります。
総じて、視線情報を用いたモデリングが歩行者挙動予測を根本的に進展させる初めての証拠を提供し、共有空間での相互作用における状況文脈の重要な役割を強調します。
これは、人々が複雑な共有空間をどのように知覚し、どう行動するかを考慮した、より安全で適応性の高い自動運転車技術への道を開きます。