このプロジェクトは、主に統治されたマルチエージェント実行の試作段階のときに、以前ここで共有しました。私はそれを継続して改良しており、現在の実装は実質的により完成度が高いので、いま実際に存在するものをもとにアップデートを投稿したくなりました。
このプロジェクトはAgentic Company OSです。これはマルチエージェント実行プラットフォームで、プロジェクトを作成し、チームのプリセットと運用モデルを選び、指示(ディレクティブ)を発行すると、統治された実行環境の中でエージェントのチームが計画し、実行し、レビューし、エスカレーションし、作業を永続化します。
現在実装されているもの:
- バラバラに共有された1つの実行フローではなく、プロジェクト単位のランタイム
- より広いUI面:Dashboard、Ticket Board、Agent Console、Artifacts、Governance、Observability、Operations、Team Config
- 承認、CEOへの質問、エージェントの採用、そして一時停止/再開のためのガバナンス・ワークフロー
- クォータ、スナップショット、リプレイ/ポストモーテムの検査、タイムラインのレビュー、ランタイム健全性のための運用ツール
- 役割、スキル、プロバイダ/APIキーの管理、運用モデルのためのチーム設定
- 権限チェックと監査ログを備えたMCPによるツールアクセス制御
- イベント、アーティファクト、エスカレーション、ランタイム状態、クォータ、ツール呼び出し監査データのためのSQLiteベースの耐久(デュラブル)状態
建築(アーキテクチャ)として面白いと思っているのは、「エージェントにツールを使わせる」ことだけが焦点ではない、という点です。焦点はそれらの周りの実行環境にあります:
- 分離されたプロジェクト・ランタイム
- 明示的なガバナンス層
- 設定可能な運用モデル
- 耐久/リプレイ可能な状態
- 制御されたツール境界(ツールの境界条件)
- 運用上の復旧プリミティブ
技術スタックは引き続きフロントエンドがReact + TypeScript、バックエンドがFastAPIで、永続化にSQLite WAL、ツール統合にMCPを使用しています。LLMプロバイダは差し替え可能(プラグ可能)であり、さらにアプリはチーム/ガバナンス/ランタイムの構成を、プロダクト上でより多く直接公開するようになりました。
それでもシングルノードで、無限にスケールするふりはしていません。現時点での狙いは、運用モデル、ランタイム境界、ガバナンスの提供面における正しさ(correctness)です。
もし興味がある方がいれば、次の点についてさらに詳しく共有できます:
- プロジェクト・ランタイムの設計
- ガバナンスと承認フローの設計
- MCP/ツールの権限モデル
- スナップショット/リプレイ/リカバリのアプローチ
- チームプリセットと運用モデルがどのように表現されるか
もしよければ時間を見つけてアプリにアクセスし、そのようなアプリを使いたいかどうかを考えてみてください。
アプリは実行しなくてもレビューできますが、プロジェクトを実行したい場合は、AnthropicまたはOpenAIのAPIキーと、私からの招待コードが必要です。
[link] [comments]




