GazeOnce360: 魚眼レンズベースの360度複数人物視線推定とグローバル-ローカル特徴融合
arXiv cs.CV / 2026/3/19
📰 ニュースSignals & Early TrendsModels & Research
要点
- GazeOnce360は、テーブル上に取り付けられた1台の上向き魚眼カメラを使用して、360度のシーンをカバーするエンドツーエンドの複数人物視線推定モデルを提案します。
- 本手法は、回転畳み込みと明示的な目のランドマーク監視を用いて、魚眼歪みと視点変動に対処します。
- また、Unreal Engineでレンダリングされた大規模な合成データセット MPSGaze360 を提案します。多様な複数人物構成と正確な3D視線および目のランドマークアノテーションを含みます。
- デュアル解像度アーキテクチャは、低解像度のグローバルな文脈と高解像度の局所的な眼領域を融合し、細かな眼の特徴を捉えます。
- 実験結果は各コンポーネントの有効性を示し、詳細情報へのプロジェクトページを提供します。
関連記事
EU AI Act適合性のために11,529台のMCPサーバをスキャンしました
Dev.to

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す
THE DECODER
Kreuzberg v4.5.0: Doclingのモデルをとても気に入ったので、より高速なエンジンを搭載しました
Reddit r/LocalLLaMA
今日は、qwen 120B のような比較的大きめのローカルモデルを動かすには、どんなハードウェアを用意すべきか?
Reddit r/LocalLLaMA
会議ノート作成のためにMistralをローカルで実行することは、私の用途には正直十分だ
Reddit r/LocalLLaMA