AIエージェントは、人間のように組織を運営することができるか

Yu, Z et al. (2026). From skills to talent: Organising heterogeneous agents as a real-world company.
今回の研究は、複数のAIエージェントを用いて、会社のように人材を採用し、役割を割り当て、成果をレビューし、組織として改善していく「OneManCompany(OMC)」という仕組みを設計・検証したものです。
研究の方法

Yu, Z et al. (2026). From skills to talent: Organising heterogeneous agents as a real-world company.

Yu, Z et al. (2026). From skills to talent: Organising heterogeneous agents as a real-world company.
この論文で紹介されているOMCは、たくさんのAIエージェントを「会社の社員(以下、AI社員)」のように働かせる仕組みです。OMCでは、それぞれのAI社員に役職や得意な仕事を与えて、会社のようにチームで仕事を進めます。
1. Talent–Containerアーキテクチャ
AI社員は、「Talent」と「Container」から構成されています。
Talent
AI社員がどのような役割を持つのか、どのような考え方で働くのか、そしてどのようなスキルや道具を使えるのかといった、中身の部分。Container
AI社員が実際に仕事をするための作業環境。
このような構成により、様々な種類のAI社員が同じ会社の中で働きやすくなります。
2. Talent Market
これは、AI社員を探して採用するための「人材データベース」のようなものです。
先述のTalentにより、各AI社員は「研究者」「デザイナー」「プログラマー」といった役割やスキルが与えられているので、会社を興すときに必要な人材が採用できるように、Talent Marketが用意されています。
OMCでは、現在のチームに足りない能力があると判断された場合、人事担当に相当するAI社員がTalent Marketから候補者を探すことになります。そしてCEOの承認を得られると、晴れて新しいAI社員として採用されます。
3. Explore–Execute–Review(E2R)
仕事は、「考える→実行する→確認する」という流れで進みます。
OMCでは、まず大きな仕事を小さな作業に分け、次にそれぞれの作業をどのAI社員に任せるかを決め、作業が終わったらその結果を上司役のAI社員や評価役がチェックします。
論文では、仕事の作業ステータスが「completed(完了)」になっただけでは不十分で、上司が確認して「accepted(承認)」のステータスになる必要があると説明されています。
4. AI社員の成長
AI社員は、仕事が終わった後に「今回は何がうまくいったか」「どこを改善すべきか」「次はどう働けばよいか」を振り返ったり、CEO役のAIエージェントと1対1で面談したりして、成長することができます。
さらに、プロジェクト全体が終わった後にはCOO役のAIが振り返りを行い、そこで得られた学びは「次から同じ仕事をするときの手順書」として保存され、次のプロジェクトでよりよく仕事を進めるための資料となります。
また、人事部では一定回数ごとにAI社員の働きぶりが評価され、成績が悪いAI社員は改善プログラムに配置されますが、それでも改善されない場合は、そのAI社員はチームから外れる可能性もあります。
5. 評価
論文では、OMCを「PRDBench」というベンチマークで評価しています。
PRDBenchは、プロジェクトレベルのソフトウェア開発のタスクを評価するベンチマークで、50件のタスク、20以上の領域、プロダクト要求仕様書、テスト計画、評価スクリプトなどから構成されています。
結果
1. PRDBenchで、84.67%の成功率

Yu, Z et al. (2026). From skills to talent: Organising heterogeneous agents as a real-world company.
OMCは、PRDBenchで84.67%の成功率を達成しました。
比較対象の中で最も高い成功率であり、最良のベースラインを15.48ポイント上回ったと報告されています。
また、50タスク全体のコストは345.59ドル、1タスクあたり約6.91ドルと報告されていますが、この点に関してはベースラインのコストが報告されていないため、厳密に費用対効果を比較できるわけではないことに注意が必要です。
2. ケーススタディ
論文では、以下の4つのケーススタディも紹介されています。
AIに関するニュース記事を作る
GitHub上のAI Agent関連リポジトリについて、週ごとのトレンド記事を作るタスクです。OMCは調査が得意なResearcherと文章を書くのが得意なWriterを採用し、調査、記事作成、メール送信までを行いました。
かかった時間は10分未満、約4.48ドルで完了したと報告されています。ストリートファイトゲームを作る
ここでは、絵を作るArt Designerと実際にゲームを作るGame Developerが協力しました。最初に外部の評価者から「キャラクター画像の分け方に問題がある」と指摘されたため、OMCはArt Designerに新しいスキルを追加し、もう一度作業をやり直しました。
これは、失敗を見つけて、必要な能力を追加し、もう一度挑戦することができた例になります。オーディオブック風の動画を作る
この仕事では、脚本を書くAI社員、画像を作るAI社員、音声を作るAI社員、音楽を入れるAI社員、動画にまとめるAI社員がタスクを担当しました。結果として、16のシーン、16個の音声、BGM、2本の動画を作ったと報告されています。AIの研究について調べる
身体を持つAIや、ロボットのための世界モデルに関する研究を調べる仕事です。OMCはこの仕事のために、研究者役のAI社員、論文を読むAI社員、AI技術に詳しいエンジニア役のAI社員をチームに入れ、論文を調べ、内容を整理し、マインドマップを作り、さらに新しい研究アイデアを3つ出しました。
この作業は1時間未満で終わり、費用は16.26ドルだったと報告されています。
これらのケーススタディから、OMCは人間の会社やチームのように、AI社員を組織して働かせる仕組みとして機能しうることが示唆されました。
注意点
ソフトウェア開発以外の領域の仕事でも、同様の結果が得られるとは限りません。
OMCのどの要素がどれだけ性能向上に寄与したのかは、十分に検証されていません。
OMCの考え方は人間社会でも大事になる
役割分担、情報共有、確認プロセスの重要性
今回紹介したOMCは、個々のAI社員の能力だけでなく、「誰に何を任せるか」「どのように連携するか」「成果をどう確認するか」「失敗から何を学び、次にどう活かすか」を重視する仕組みですが、これは人間社会における組織づくりや働き方を考えるうえでも、重要な考え方だと思います。
どれほど優秀な人が集まっていても、役割分担が曖昧で、情報共有が不十分で、成果物の確認プロセスがなければ、恐らく組織としての力は発揮されないでしょうし、逆に個々の能力が突出していなくても、OMCのような仕組みが整っていればチーム全体として高い成果を出すことができると考えられます。
そしてこれは、調剤薬局でも恐らく同様のことが言えます。
仕事ができる管理薬剤師が1人で何もかもをこなしてしまうと、管理薬剤師自身が疲弊するだけでなく、管理薬剤師がいないときに業務が回らなくなるリスクもあり、調剤薬局全体で見たときに質が下がってしまう可能性があります。
ゆえに、適切な役割分担、情報共有、確認プロセスを業務に組み込むほうが、結果的に調剤薬局の質の向上につながると考えられます。
具体的には…
役割分担
絵を書くのが得意な人には薬局の掲示物やお知らせなどのイラストを描いてもらったり、Officeを使いこなせる人には各種提出書類などの作成をしてもらったり、生成AIを普段から使っている人には業務の効率化を先導してもらったりするなど、職種にこだわらずにスタッフひとりひとりのスキルや得意分野を見つけて役割を与える。情報共有
「かかってきた電話の内容」「届いていたご意見の内容」「業務に関する何らかの変更点」「疑義照会の事例」「ヒヤリ・ハットの事例」などを共有するために、チャットツールやメモアプリ、もしくは薬局内の共有ノートに記録できるような体制を整えておく。確認プロセス
何らかのコンテンツを作成した場合は、必ず別のスタッフ(担当者もしくは管理薬剤師など)が確認し、承認する。
このようなイメージです。
こういった仕組みを整えるには時間がかかりますが、それでもこのような体制を整えることで、特定の個人に負担が集中してしまうことをある程度抑制できますし、特定の人しか知らない情報をなくすことも可能になり(誰でも対応できるようになり)、チームとしての質を向上させられます。
目新しい考え方ではないかもしれませんが…
もちろん、この考え方自体は目新しいものではなく、既に実践されている調剤薬局も多いかもしれません。ただ、誰でも生成AIやAIエージェントを活用できる現代においては、自分の得意な領域を超えて様々なタスクをこなせるようになったので、この考え方がより一層重要になってきます。
というのも、生成AIが業務に組み込まれることにより、以下のようなリスクが上昇する可能性があるからです。
ただ、このような追加業務が増えることにより、以下のようなリスクが増えるかもしれません。
・気づかないうちに業務の範囲が広がり、各スタッフが休憩中や業務時間外にも仕事のことを考えてしまうようになる
・本人が気づかないうちに疲労や認知的負荷が蓄積し、判断力が低下したり、調剤・監査・服薬指導において過誤が起こりやすくなったりする
・上記のような状態が続くことにより、燃え尽き症候群に至る
これらに加えてもう一つ補足すると、シャドーIT(シャドーAI)のリスクも無視できません。特に休憩中や業務時間外に仕事のことが頭をよぎった場合に、スタッフが自身の端末(薬局内で管理・把握していない端末)で仕事をしてしまったり、生成AIに色々質問してしまったりする可能性があります。
個人情報や機密情報を保護するという観点からも、業務時間とそれ以外の時間を明確に区別できるように仕組みを整える必要があるでしょう。
こういったリスクを防ぐために、生成AIの用途を限定する(役割分担)、生成AIで何をしているかを共有する(情報共有)、そして成果物を実際に公開する前に必ず確認をしてもらう(確認プロセス)ことが重要になります。
一見、自由を制限されるような感覚で窮屈に感じるかもしれませんが、この窮屈さが結果的に自分を守ることにもつながります。
なので今一度、役割分担・情報共有・確認プロセスに関して見直してみてはいかがでしょうか。
<関連記事>
最後までお読みいただき、ありがとうございました。
Webサイト「薬剤師のためのAIノート」も、是非ご覧ください。
記事に関する内容以外のお問い合わせは、以下のフォームよりお願いいたします。
また、書籍「超知能時代の調剤薬局」発売中です。
Kindle Unlimited会員の方は無料で読むことができます。





