最近の実験で、Anthropicは分類されたマーケットプレイスを作り、AIエージェントが買い手と売り手の両方を担うことで、実在の商品と実在の金銭を用いた本物の取引を成立させました。
同社は認めたこのテスト——同社が「プロジェクト・ディール(Project Deal)」と呼んだもの——は、「自己選択による参加者プールを用いた、69人のAnthropic従業員を対象とする試験的な実験」にすぎず、従業員には(ギフトカードを通じて支払われる)予算100ドルが与えられ、自分の同僚から商品を買うようにしました。
それでも、Anthropicは「プロジェクト・ディールがどれほどうまく機能したかに衝撃を受けた」と述べており、成立した取引は186件で、価値の合計は4,000ドル超でした。
同社によれば、実際には異なるモデルで4つの別々のマーケットプレイスを運営しました。1つは「実際のもの」(全員が同社の最も先進的なモデルで代表され、実験の後に取引が実際に履行された)で、残りの3つは調査のためでした。
どうやら、ユーザーがより高度なモデルによって代表されると、「客観的により良い結果」が得られるとAnthropicは述べています。とはいえ、ユーザーはその格差に気づいていないようで、「負け側にいる人は、自分が不利な状態にあることを理解できないかもしれない」という「『エージェントの品質(agent quality)』のギャップ」が生じる可能性が示唆されます。
また、エージェントに最初に与えられた指示は、販売の可能性や交渉された価格には影響していないようでした。
