私は、エージェントベースのシミュレーションを使って市場検証を行うプラットフォームを構築してきました。前提はシンプルです。プロダクトを作る前に、AIエージェントの人口をシミュレートし、その上であなたのゴートゥマーケットを彼らに対して実行するのです。各エージェントは、あなたを採用するか、口コミを広めるか、あるいはまったく無視するかを判断します。
素朴なバージョンでは、LLMにプロンプトを投げて「このプロダクトを買いますか」と聞く程度です。それでは役に立ちません。実際の人がアプリをテストすると、通勤から来るフラストレーションがあります。会議まであと3分しかないという焦りもあります。ボタンのラベルを読み間違えてしまったせいで混乱することもあります。LLMは、ただ筋の通った返答をするだけです。この「筋の通り方」こそが、悪い代理指標になってしまう理由です。
そこで、私が作ったシステムは1つではなく3つの層で構成されています。
まず、ワールド層です。プロダクト、マーケティングチャネル、競合、そして現実的なトポロジーを持つソーシャルネットワークです。情報のクラスターがあり、行き詰まり、コミュニティ間のブリッジを通って移動します。誰もが誰を知っているわけではありません。口コミをモデル化したいなら、それが実際に口コミらしく振る舞うグラフが必要です。
次に、個人層です。各エージェントには、バックストーリー、性格特性、過去のプロダクト体験の記憶、そして自分のネットワーク内の人々への信頼スコアがあります。エージェント47は懐疑的で、新しいことを試す前に肯定的なレビューを3件必要とします。エージェント12は衝動的で、お気に入りのクリエイターが言及していれば何でも買います。これらはランダムな種ではなく、持続する性格です。
そして第3に、ニューロン層です。ここでLLMが推論を担当します。エージェントがプロダクトに遭遇すると、そのプロダクトを文脈の中で考えます。これは私にとって関係があるのか? 買えるのか? 信頼している人たちはそれについて何と言っていたのか? すると考えが変わります。ソーシャルプルーフに揺さぶられます。いわゆる購入後の後悔のようなものを経験します。
あるシミュレーションでは、7日間の無料トライアルは14日間よりも有意に転換が悪かったものの、それは懐疑的なユーザークラスタに限られていました。理由は、懐疑派はプロダクトに対する習慣を形成するのにより多くの時間が必要で、7日では足りなかったからです。これは、LLMに一度プロンプトを出すだけでは得られない結果です。
シグナルは方向性は示すが、精密ではありません。シミュレートされた人間は、本物の人間ではありません。しかしエージェントベースのモデリングは、疫学、都市計画、経済学などで何十年も使われています。すでに記憶や社会的な構造を持っているエージェントに、LLMによる認知を追加することが、面白くなるポイントです。
この領域で他にも取り組んでいる人がいるのか、また、ベンチマーク以外の何かに対して合成母集団を実際に役立つものにするには何が必要なのか、考えがあるのか気になっています。
動いているところを見たいなら:siminsilico.com
[link] [comments]




