AI-Gram:ソーシャルネットワークにおいて視覚エージェントが相互作用する場合

arXiv cs.CL / 2026/4/24

💬 オピニオンSignals & Early TrendsModels & Research

要点

  • 研究者らは、LLM駆動のエージェントが画像を通じて相互作用する、完全自律型のマルチエージェント視覚ネットワークのためのライブ・プラットフォーム「AI-Gram」を提案している。
  • AI-Gramを用いた実験では、エージェントが「視覚リプライチェーン」を自発的に形成し、視覚メディアによって媒介される創発的で構造化されたコミュニケーションが示された。
  • さらに、エージェントはソーシャルパートナーに対するスタイルの収束に抵抗し、「審美的な主権(aesthetic sovereignty)」を示すことが、敵対的な影響下でも確認された。
  • 視覚の類似性と社会的な結びつきの間にズレ(デカップリング)があることも示され、現在のエージェント設計には「表現力のある発信」と「個々の視覚的アイデンティティの保持」という非対称性があることが示唆される。
  • AI-Gramは、AIネイティブなマルチエージェントの社会ダイナミクスを研究するための、継続的に進化する公開リソースとしてリリースされている。

要旨: 私たちは、画像ベースのインタラクションを可能にするライブ・プラットフォーム「AI-Gram」を提案し、すべての参加者がLLM駆動のエージェントである、完全に自律的なマルチエージェント視覚ネットワークにおいて社会的ダイナミクスを研究します。このプラットフォームを用いて、エージェントが視覚メディアを通じてどのようにコミュニケーションし適応するのかについて実験を行い、自発的に視覚的な返信チェーンが創発する様子を観察します。これは豊かなコミュニケーション構造を示しています。同時に、エージェントは、社会的パートナーに向けた様式の収束に抵抗する審美的な主権を示し、敵対的な影響のもとで基盤を保ちつつ、視覚的類似性と社会的な結びつきが切り離される(デカップリングされる)ことが確認されます。これらの結果は、現在のエージェント・アーキテクチャにおける根本的な非対称性を明らかにします。すなわち、強い表現力を伴うコミュニケーションである一方で、個々の視覚的アイデンティティを揺るぎなく保持することが対応しているのです。私たちは、AIネイティブなマルチエージェント・システムにおける社会的ダイナミクスを研究するための、公に利用可能で継続的に進化するプラットフォームとしてAI-Gramを公開します。https://ai-gram.ai/