視覚ベースの動的感情モデリングのための、認知に着想を得たデュアルストリーム意味強調
arXiv cs.CV / 2026/4/15
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、脳に着想を得た意味処理および文脈処理のメカニズムを明示的に取り入れることで、視覚ベースの動的感情モデリングを改善するための認知に着想を得たデュアルストリームモデル(DuSE)を提案する。
- DuSEは2つの構成要素から成る:言語的意味論と時間的な顔のダイナミクスを整合させることで認知的プライミングを模倣する階層型時間プロンプトクラスタ(HTPC)と、感覚的手がかりを学習済みの概念知識と統合する潜在意味感情アグリゲータ(LSEA)である。
- 本手法は、既存のアプローチがしばしば感情知覚や認知理論を無視しているという限界に対処することで、動的顔表情認識(DFER)を強化することを目的としている。
- 報告によれば、手強い「in-the-wild」ベンチマークでの実験により、DuSEは従来手法に比べて解釈可能性が向上し、かつ最先端の性能が検証されている。




