AIに本物の脳を与えた方法――会社の半分を動かすシステム

Dev.to / 2026/3/23

💬 オピニオンDeveloper Stack & Infrastructure

要点

  • RenoClear は、個人創業者向けのリノベーション透明性プラットフォームであり、AI がビジネスの一部を効果的に運用できるよう、永然的なメモリシステムに依存している。
  • この記事はデジタル記憶喪失を根本的な問題として特定しており、AIツールはセッション間で文脈を忘れてしまうため、1回のコーディングセッションにつき15〜20分の再認識が生じ、日々の生産性の損失が90〜160分になる。
  • 解決策は、単純でありながら強力な永続的メモリ脳です:MEMORY.md をマスターインデックスとする構造化されたマークダウン知識ベースと、各エントリのメモリファイルが自動的にすべてのAI会話に読み込まれる。
  • その結果、コードベース、過去の意思決定、コンプライアンスルール、ブランドガイドライン、認証情報を知るAIエージェントが生まれ、積極的な衝突検出と非推奨事項の検出・認識を可能にしつつ、大規模な人材チームの必要性を低減させる。

私がAIに本物の脳を与えた方法:私の会社の半分を動かすシステム

三か月前、私はAIと14回目となる同じ会話をしました。

「v2ストレージキーを使い、古いものは使わない。」 「中国語版には外国のAIツールについて言及しないでください—コンプライアンスのためです。」 「APIプロキシはクラウドファンクションを通じて行われ、直接呼び出しはしません。」 毎回のセッションで、私は同じ教訓を繰り返し教え直していました。私のAIアシスタントは128Kトークンの注意力しか持たない金魚の記憶力で、長期記憶は全くありませんでした。

私は、リノクリア RenoClear というリノベーションの透明性プラットフォームを一人で作っています。これは、住宅所有者と請負業者が互いに騙し合いをやめるのを支援します。中国向けにはWeChatミニプログラム、その他の地域にはグローバルなWebアプリ。17の取引カテゴリ、AI搭載の見積もり監査、間取り認識、予算エンジン ― 全機能。通常は5人のエンジニア、2人のプロダクトマネージャー、そしてコンテンツチームが必要な製品です。

私はそんな人材を持っていません。私が持っているのはシステムです。

8週間かけて構築した後、私のAIエージェントはコードベース、過去の決定、コンプライアンスルール、ブランドガイドライン、API認証情報の場所、そして私のお気に入りの変数名付け規則を知っています。彼らは私が見逃す競合を検出します。私が忘れた非推奨事項を覚えています。新機能が6週間前に下した決定と矛盾する場合には、積極的に警告します。

これが私の作り方です。

問題点:デジタル記憶喪失

市場に出ているどんなAIツールにも同じ根本的な欠陥があります:会話は使い捨てです。タブを閉じれば文脈は蒸発します。新しいセッションを開くと、賢いだけの他人と話していることになります。

日常的な用途にはこれで問題ありません。会社を運営するには?それは災害です。

私は、AIを再度速さまで引き戻すための最初の15〜20分を毎回のコーディングセッションの中で費やしていました。ファイル構造を貼り付け、アーキテクチャの決定を説明し、ストレージキーの移行を思い出させ、再度、中国語のコンテンツが Claude や ChatGPT の名称を参照してはいけないことを伝えていました。国内のコンプライアンス規則のためです。

その数学は過酷でした。1日あたり6〜8セッションで、再オリエンテーションだけに日々90〜160分を費やしていました。これは1人のエンジニアの生産的な午前を丸ごと失うことを意味します。

この問題を一度だけ正確に解決する必要がありました。

脳:持続的記憶システム

解決策は概念的には恥ずかしいほど単純で、実践的には驚くほど強力でした:すべてのAI会話に自動的に読み込まれる構造化されたマークダウンの知識ベースです。

以下がアーキテクチャです。私のユーザープロファイルのルートには、AIが起動時に読み込むディレクトリがあります。その中には MEMORY.md というファイルがマスタインデックスとして機能します―AIが知るべきすべての情報を指し示す200行以内の目次です。冗長性は有用性を殺します。各エントリは、より詳細を含む専用の記憶ファイルへリンクします。

Memory System Structure

各メモリファイルには3つの重要なフィールドを含む YAML フロントマターがあります:

---
name: cn_compliance
type: feedback
description: "Content compliance rules for Chinese domestic platforms"
---

The type フィールドこそが魔法が起こる場所です。私は4つのカテゴリを使用します:

4つの記憶タイプ

  • user — 私が誰か。私のコーディングスタイル、好み、コミュニケーションパターン。AIは、私がバッチ処理を逐次の手取り足取りより好むこと、私がシステム思考であること、1セッションで50ラウンドを推し進め、AIがペースを維持することを期待する、ということを学習します。
  • feedback — 避けるべきことと繰り返すべきこと。これが最も重要なタイプです。AIがミスをして私が修正すると、その修正は保存されます。AIが素晴らしいことをして私がそれを確認すると、その確認も保存されます。時間が経つにつれて、これは検証済みのアプローチと既知の落とし穴のライブラリになります。
  • project — 進行中の作業状態。現在のバージョン番号、未コミットの変更、反復の進捗、アーキテクチャの決定。AIは前回のセッションが残した場所から正確に再開します。
  • reference — 物を見つける場所。API認証情報、リポジトリURL、クラウド設定、公開ワークフロー。秘密そのものではなく、それらへの手掛かりです。

自己維持ループがこれをただの美化されたREADME以上のものにします。主要なタスクの後、AIは自分のメモリファイルを更新します。50ラウンドの反復スプリントを終えましたか? AIはiteration-progress.md に要約を書きます。新しいコンプライアンス規則を発見しましたか? それはフィードバックメモリに入ります。API提供者を変更しましたか? 参照ファイルが更新されます。

自己維持メモリループ

私はこのシステムを自分で維持しているわけではありません。システムが自分で維持します。

8週間後、蓄積された内容は以下のとおりです:競合分析、API認証情報の場所、公開ワークフロー、コードアーキテクチャの決定、ストレージキーの移行、2つの市場向けブランドガイドライン、2か国における著作権申請状況、デプロイ通知のためのTelegramボットの正確な認証情報。

今新しいセッションを開くと、AIは単に私のプロジェクトを知っているだけでなく、その履歴を知っています。

Four Desktops, Four Agents

1つのAIエージェントは、どれだけ詳しくても天井に達します。コンテキストウィンドウには限界があります。1つの会話にすべてを詰め込もうとすると、専門知識が薄まります。だから、私は作業を4つの仮想デスクトップに分け、それぞれが自分のドメインの完全な文脈を持つエージェントを実行します:

Desktop 1: アプリ開発。 これは核となる部分です。Claude Code CLI がここで動作します — ターミナルレベルのAIエージェントで、コードを直接読み書き編集します。シェルコマンドを実行し、git操作を管理し、ビルドを実行します。ここでミニプログラムとウェブアプリが構築されます。1回のセッションを、50回連続の反復で押し進める — 基本的なUIの骨組みからAIエンジンの統合、セキュリティ強化、そして17の取引カテゴリを持つ完全な価格データベースまで。

Desktop 2: 自動化。 コンテンツパイプラインはここにあります。記事生成、マルチプラットフォーム出版、カバー画像作成。このエージェントは出版ワークフローを熟知しています。

Desktop 3: 「Heaven」。 クリエイティブ作業。ブランド戦略、コピーライティング、デザインディレクション。最高のクリエイティブアイデアは、無理に絞り出すのではなく、空から降ってくるように感じるため、私はそれを Heaven(天国)と名付けました。

Desktop 4: 日常業務。 行政タスク、コミュニケーション、プロジェクト管理。まだやらなければならない地味な作業。

興味深いエンジニアリングの課題は、エージェント間の通信でした。これらのエージェントは直接会話できません — 別々のデスクトップで別々のプロセスとして動作しています。なのでブリッジシステムを作成しました。

共有ディレクトリ(handoff/bridges/)の下に、各デスクトップは自分のフォルダを持っています。あるエージェントが別のエージェントへ作業を引き継ぐ必要があるとき、ターゲットのブリッジディレクトリに構造化ファイルを書き込みます。受信側のエージェントは次回セッションの開始時にそれを受け取ります。これは、ローカルファイルシステム上のマークダウンファイルだけで実装された非同期メッセージ伝送です。

4-Desktop Bridge System

オーケストレーションフレームワークも、APIレイヤーも、データベースもありません。見つけるべき場所を知っているエージェントによって読み書きされる単なるフォルダ内のファイルです。

それが機能するのは、メモリシステムが各エージェントにブリッジディレクトリの場所と期待する形式を伝えるからです。その規約は共用ナレッジベースに文書化されています。すべてのエージェントが同じルールを読むため、同じプロトコルを全エージェントが遵守します。

Claude Code CLI: コアエンジン

コーディング側を機能させる具体的なツールについて話すべきです。なぜなら、それがほとんどの開発者が関心を持つ部分だからです。

Claude Code はターミナルレベルで動作する CLI ツールです。欲しいものを説明してAIが近いものを生成されることを期待するチャット型のインターフェースとは異なり、Claude Code は直接ファイルシステムにアクセスします。Read、Write、Edit、Bash、Grep、Glob というツールシステムを備えており、開発者が行うようにコードベースとやり取りすることができます。

非推奨のストレージキーを参照しているすべてのファイルを見つける必要がありますか? Grep。プロジェクト構造を理解する必要がありますか? Glob。ファイル全体をすべて書き換えずに関数を編集する必要がありますか? 外科的な文字列置換を用いた Edit。テストを実行するか、プロジェクトをビルドする必要がありますか? Bash。

この点が重要なのは、フィードバックループが即座に機能するからです。AIは変更を加え、ビルドを実行し、エラーを確認して修正します — 全て同じ会話内で完結します。チャットウィンドウとIDEの間でコピー&ペーストする必要はありません。 「これがコードです。試してみて、動かなければ戻ってきてください」という指示もありません。

50 Rounds in One Session

ミニプログラムの50回連続反復スプリントの間に、1回の連続セッションで構築されたものは次のとおりです:

  • ラウンド 1-10: ページアーキテクチャ、ナビゲーション、Apple Design Language に沿った基本 UI コンポーネント
  • ラウンド 11-20: 17 の取引カテゴリ用の計算エンジン、間取りグループ化された価格設定
  • ラウンド 21-30: AI統合 — 画像認識モデルによる見積もり監査、間取り図認識、予算生成
  • ラウンド 31-40: データ正確性の強化、実勢市場レートを含む価格データベース、ストレージ互換性レイヤー
  • ラウンド 41-50: セキュリティレビュー、コンプライアンス修正、パフォーマンス最適化、バージョンアップ

各ラウンドは前のラウンドを土台にして構築されました。AIは、38ラウンドに取り組んでいたときに、12ラウンドで行ったことを覚えていました。なぜなら同一セッションだったからです。そしてセッションが終わると、メモリシステムがすべてを記録して、次のセッションが途切れなく続けられるようにしました。

重要な洞察: Claude Code は単にコードを書くだけではありません。自分のコンテキストを管理します。大きな変更ごとに、プロジェクトのメモリファイルを更新します。何が変わり、なぜ変えたのか、次のステップは何かを記述します。AI自身が自分のプロジェクトマネージャーです。

コンテンツファクトリー

コードを出荷することは仕事の半分です。もう半分はそれを人々に伝えること。ソロの創業者にとって、コンテンツマーケティングは通常犠牲にされるものです — 作ることに忙しく、作る過程について書く余裕がないのです。

だから私はそれを自動化しました。

コンテンツパイプラインは、Text_Publisher と呼ばれる Python システムです。完全なライフサイクルを処理します:記事を書き、8つの品質指標(10点満点中9.9を目標とする)で採点し、Remotion Still テンプレートを使ってカバー画像を生成し、WeChat Official Account、知乎、Dev.to、Hashnode の4つのプラットフォームに同時に公開します。

決定的な設計方針: 三言語のコンテンツは独立して作成され、翻訳はされません。中国語の記事は中国の読者向けに中国の文化的文脈と国内ツールの参照を用いて書かれます。英語の記事は世界的な読者向けに、実際のツール名と異なる構成で書かれます。繁体字中国語版は台湾市場向けの独自の声を提供します。

これは虚栄心ではありません。これはコンプライアンスです。中国国内のプラットフォームには、外国製AIツールへの言及に関する厳しい規則があります。「私が Claude Code をどう使うか」という記事は、WeChat で指摘されたり抑制されたりします。だから中国語版は、同じ話を異なるツール名で伝えます。英語版は、制限がないため実名を使います。

メモリシステムがこれをシームレスにします。中国語コンテンツのコンプライアンス専用のフィードバックメモリファイルがあります — AIは中国語コンテンツを作成する前にそれを読み込み、自動的に規則を適用します。手動のチェックは不要です。

Telegram ボットが記事が公開されると通知を送信します。私は通常、昼食をとりながらスマホで確認します。コンテンツマーケティングへの総投資時間は、1日あたり約20分のレビューです。残りはシステムが処理します。

複利効果

持続的なAIメモリについて誰も教えてくれないこと: 価値は指数関数的に増大します。

The Compound Effect

Week 1: AIは基本を知っている。プロジェクト構成、技術スタック、私の名前。役に立つが、汎用的だ。新入社員がオンボーディング資料を読んでいるようだ。

Week 4: AI はすべてのアーキテクチャ上の決定、すべての API 移行、すべてのバグ修正パターンを記憶している。calc_store_v2 キーは部屋ごとにグループ化された構造を使用する一方で calc_store はフラットで、後方互換性のために両方を同時に書く必要があることを知っている。これは AI がそのコードを書き、決定の根拠を保存したからこそ知っている。

Week 8: AI は積極的になる。「この新機能は第3週に設定したコンプライアンスルールと衝突します。」 「このストレージキーは v0.8 で非推奨になっています — 参照を移行すべきですか?」 「前回、このアプローチを予算エンジンで試したとき、iOS でレンダリングの問題を引き起こしました。代替パターンを使いましょうか?」

これが、それが道具のように感じるのを止め、チームメンバーのように感じ始める瞬間だ。完璧な記憶力を持ち、休暇を取らず、悪い日を過ごさないチームメンバーだ。

50以上のメモリーファイルは静的な文書ではありません。対話のたびに密度が増し、より有用になる生きた知識グラフです。古い決定の間に新しい結びつきが生まれます。私が気づかなかったパターンが現れます。AIは私のプロジェクトを私よりも全体的に見るようになります。それは毎回、実際にすべてのドキュメントを読むからです — 人間が一貫して行えることではありません。

実際のROI

このシステムが生み出すものを具体的に説明します:

  • 一人・一製品・二市場。 RenoClear は中国(WeChat ミニプログラム)とグローバル(ウェブアプリ)で、共通のビジネスロジックと市場別の UI で提供します。通常は二つのチームの仕事です。
  • 一回のセッションで50回の反復。 小規模なチームが数週間もかかる機能を数時間で構築します。AI が人間よりコードを書くのが速いからではなく—単純なタスクではむしろ遅い—フィードバックループの待機時間がゼロ、文脈切り替えコストがゼロだからです。
  • マルチプラットフォーム公開、自動化。 4つのプラットフォーム、3つの言語、カバー画像、品質スコアリング。コンテンツマーケティングは自動運用です。
  • 著作権を同時に2か国で登録。 中国(ソフトウェア著作権)と米国(eCO 登録)。システムは両方の申請を追跡し、異なる要件を管理し、ステータスを私に知らせてくれました。
  • 従業員ゼロ。ほぼゼロの運用コスト。 私の費用は API クレジットとドメイン登録料だけです。それだけです。

これがすべての場合においてチームを置換すると主張しているわけではありません。複雑な調整、人間関係の管理、営業コールはまだ人間が必要です。しかし、技術製品の「作る・出す・市場へ」ループにおいては? 永続的な記憶を持つ適切に設定された AI システムが驚くべき範囲をカバーします。

自分のバージョンを作る方法

私の正確な設定は必要ありません。原則が重要です。実践的な開始チェックリストをどうぞ:

メモリレイヤー(ここから始めましょう)

  1. .claude ディレクトリを作成(あなたの AI ツールの同等のものを含む)を、あなたのユーザープロファイルとプロジェクトのルートに作成します。
  2. CLAUDE.md をプロジェクトのルートに作成し、以下を含めます: プロジェクトの目的、ディレクトリ構造、ハード制約、技術スタック。200行未満にしてください。これがAIのオンボーディングドキュメントです。
  3. MEMORY.md のインデックスファイルを作成して、あなたのユーザープロファイルディレクトリに置きます。これはすべてのセッションに自動ロードされるマスター目次です。
  4. まず3つのメモリーファイルから始めます:
    • user_profile.md — あなたの好み、コミュニケーションスタイル、作業パターン。
    • project_state.md — 現在のバージョン、最近の変更、進行中のタスク。
    • feedback_rules.md — 過去のセッションからの修正と確認。
  5. 各メモリファイルには YAML フロントマターを使用し、nametypedescription フィールドを含めます。これにより、AI は各ファイルが何のためにあるかを読む前に理解します。
  6. 自己メンテナンスルールを適用する: 重要なセッションの終わりに、AI に関連する memory ファイルの更新を指示します。数回のセッションの後、AI はこれを自発的に行い始めます。

マルチエージェント層(1つのエージェントを超えたとき)

  1. ドメインをワークスペースごとに分離する。 1つのエージェントにすべてを任せようとしないでください。各エージェントに、それぞれの文脈を持つ焦点を絞ったドメインを与えます。
  2. エージェント間の受け渡し用ブリッジディレクトリを設定します。 シンプルなフォルダ構造: handoff/bridges/{agent-name}/。エージェントは相互に対して構造化されたマークダウンファイルを書きます。
  3. ブリッジプロトコルを共有メモリに文書化します。 すべてのエージェントは、ファイルをどこに落とし、どこから拾うかを知っているべきです。

コンテンツ層(言葉を出荷する必要があるとき)

  1. 公開パイプラインを構築するか、採用する。 重要な洞察: ライティングと公開を分離します。AI が書き、スクリプトが公開します。これらをデカップルドに保ちます。
  2. 市場別のコンテンツ規則をフィードバックメモとして作成します。あなたの AI は、中国語コンテンツが英語コンテンツとは異なる規則に従うことを、再度指示されなくても知っているべきです。
  3. 品質評価を自動化。 指標を定義し、閾値を設定し、それ以下を拒否します。これにより、AI のズレが視聴者に届くのを防ぎます。

マインドセット

最も重要なことはツール自体ではありません。AI の文脈をインフラとして扱い、使い捨ての会話にはしないというコミットメントです。あなたが行うすべての修正はトレーニング・シグナルです。すべての確認は強化です。すべての決定の根拠は将来の文脈です。

書き留めてください。AI が見つけられる場所に保存してください。複合効果を活かして、あとは任せておきましょう。

私は時々自分でコードを書きます。AI が決定できない決定もまだします。システムが出したものをすべて捨てて、最初からやり直す日もあります。

しかし、同じ会話を二度としません。そして、それは、いかなる単一機能や自動化よりも、資金提供を受けたチームと競争力を保つ要因となった、ソロ創業者の理由です。

このシステムは完璧ではありません。単に粘り強いだけです。窓を閉じた瞬間に他のほとんどのAI対話が蒸発する世界では、継続性はスーパーパワーです。

公開で構築中。ついてきてください: @CounterIntEng