文脈における人間らしい色名付け行動のモデリング

arXiv cs.CL / 2026/4/29

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • この論文は、参照ゲームにおける教師あり学習と強化学習で訓練した神経エージェントを用いて、人間らしい色名付け行動を計算機上でモデル化することを検討します。
  • 従来研究(NeLLCom-Lex)の重要な限界として、得られる色語彙が人間の色カテゴリと体系的にずれ、色空間上で非常に非凸な領域を形成してしまう点を指摘しています。
  • 距離幾何の整合性を高めるために、教師あり学習で希少な色語をアップサンプリングすることと、強化学習で多人数のリスナー(multi-listener)相互作用を用いることの2つを導入します。
  • 凸性に基づく尺度で学習された色カテゴリの幾何学的一貫性を定量化し、中程度のアップサンプリングと複数リスナーの組み合わせが人間に最も近い語彙をもたらすことを示します。
  • これらの結果は、希少語のサンプリング調整を含む人間データからの学習と、より豊かなコミュニケーション設定(多リスナーRL)の両方が、人間らしい実用的な色語彙の獲得に重要であることを示唆しています。

概要: 計算システムにおける人間らしい語彙の出現をモデリングする研究は、学習とコミュニケーション上の圧力の両方を模倣する相互作用するニューラルエージェントの利用によって進展してきました。NeLLCom-Lex フレームワーク(Zhang et al., 2025)は、参照ゲームにおける強化学習(RL)と、人間データからの教師あり学習(SL)を通じて、ニューラルエージェントが語用論的な色名付け行動や人間らしい語彙を発達させることを可能にします。これらの成功にもかかわらず、出現する語彙は人間の色カテゴリーから体系的に逸脱し、色空間において非常に非凸な領域を生み出します。これは、人間のカテゴリーに典型的に見られる凸性と対照的です。これに対処するために、2つの要因、すなわち SL 中に稀な色語をアップサンプリングすること、そして多人数のリスナーによる RL 相互作用を導入し、幾何学的なコヒーレンス(整合性)を定量化する凸性指標を採用します。アップサンプリングは、語彙の多様性と、色語彙におけるシステム全体の情報性を向上させることがわかり、多人数リスナーの設定はより凸な色カテゴリーを促します。中程度のアップサンプリングと複数のリスナーを組み合わせることで、人間のシステムに最も類似した語彙が得られます。