SHOE:意味論的 HOI オープンボキャブラリ評価指標
arXiv cs.CV / 2026/4/3
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、mAP のような従来の HOI 評価指標が、HOI ラベルを離散的な文字列として扱い、意味の同等性を無視するため、オープンボキャブラリ HOI 検出を十分に評価できないと主張している。
- SHOE という意味論的評価フレームワークを提案し、各予測された HOI を動詞成分と目的語成分に分解して、予測と正解の間の意味類似度を計算する。
- SHOE は、複数の大規模言語モデル(LLM)にまたがる平均化スコアリング手法により意味類似度を推定し、厳密な語彙一致に頼らず類似度ベースのスコアを算出する。
- HICO-DET などの標準ベンチマークにおける実験では、SHOE が既存指標よりも人間の判断によりよく一致し、平均的な人間評価との一致率は 85.73% であると報告している。
- 著者らは、意味に基づくオープンエンドなマルチモーダル相互作用理解に関する今後の研究を支援するため、SHOE の評価指標を公開すると述べている。




