広告

環境工学(Umwelt Engineering):言語エージェントの認知的世界を設計する

arXiv cs.CL / 2026/3/31

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、エージェント設計の「第3層」として、プロンプトやコンテキストに先行する“Umwelt engineering”(言語的な認知環境の意図的設計)を提案している。
  • 実験1では、語彙制約(No-Have: possessive “to have”の除去、E-Prime: “to be”の除去)によって、言語モデルの推論が認知的に変化し得ることを示し、No-Haveは倫理推論・分類・エピステミック校正を有意に改善した。
  • 一方でE-Primeはモデル依存の大きな影響を示し、モデル間の相関が強く負に傾くなど、挙動が大きく変わり得ることが示唆された。
  • 実験2では、言語的制約を持つ複数エージェントをデバッグ問題に適用したところ、個別では勝てない場合があっても、制約エージェントの3体アンサンブルでグラウンドトゥルース網羅率が100%に到達し、成功には特定の「反実仮想エージェント」が含まれることが示された。
  • 主要な限界として、制約プロンプトの精緻さ(プロンプト elaborateness)を一致させた能動的な対照条件がない点が挙げられている。

要旨: 私は、プロンプト設計と文脈設計の両方に先行する、エージェント設計スタックにおける第三の層として、ウンヴェルト工学――言語的認知環境の意図的な設計――を提案する。2つの実験は、推論の媒体を変えることが、認知そのものを変えるという主張を検証する。実験1では、7つの課題(N=4,470 試行)にわたり、3つの言語モデルが2つの語彙制約の下で推論する――No-Have(所有を表す “to have” を排除)および E-Prime( “to be” を排除)である。No-Haveは、倫理的推論を19.1 pp(p < 0.001)、分類を6.5 pp(p < 0.001)、さらに認識論的キャリブレーションを7.4 pp 改善しつつ、制約遵守率92.8%を達成する。E-Primeは劇的だがモデル依存の効果を示し、モデル間の相関は r = -0.75 に達する。実験2では、16の言語的制約付きエージェントが17のデバッグ問題に取り組む。制約付きエージェントは個別にはいずれも対照群を上回らないが、3エージェントのアンサンブルは対照群(88.2%)に対して、真値のカバレッジを100%達成する。パーミュテーション検定により、無作為な3エージェント部分集合で全カバレッジを達成できるのはわずか8%であり、成功したすべての部分集合には反実仮想のエージェントが含まれていることが確認される。現れるメカニズムは2つである――認知の再構成と認知の多様化。主な制限は、制約プロンプトの記述の詳しさに対応する能動的な対照(active control)が欠けている点である。

広告