Claude APIコストを50%削減:自己改変型エージェント・システムで回す方法

Reddit r/artificial / 2026/5/2

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 記事では、ClaudeのAPI利用を減らすために継続稼働(24/7)する「自己改変」型のエージェント・システム「Hollow AgentOS」が紹介されます。
  • ローカル機材(RTX 5070のPC、またはCPUでも可)で作業を回し、繰り返しの有料API呼び出しを減らすことで、Claude APIコストを約50%削減できると主張しています。
  • その仕組みは、コード提案→ビルド→テスト→編集→反復を無限に行う反復ループで、モデル代替としてQwen 3.5 9Bを用いるとしています。
  • Hollowは、サンドボックス内で自律的に改善や拡張を実装する設計で、複数エージェントの2/3多数決を経て自己更新を行う仕組みです。
  • 著者はGitHubリポジトリを公開し、制約に基づく自己主導の変更により、利用者ごとにバージョンが時間とともに分岐し得る点を強調しています。

私は、ClaudeのAPI使用量を実質半分に抑える自己書き換え型のAIエージェントシステムを開発してきました。Claudeに考えさせ、その後は基本的に、エージェントが作業するためのClaudeの指示をそのままコピペするだけです。6時間後に戻ってくれば、ローカルのハードウェア上で無料で完了しています。以下で、この仕組みを正確に説明します。

Repo: https://github.com/ninjahawk/hollow-agentOS

それは何か:

私のRTX 5070のゲーミングPCで24時間365日動いています(ただし、CPUでもどんなノートPCでも動かせます。もちろんその場合は遅くなります)。私は、X時間かければ解けるようなタスクを切り出して任せるためにこれを使っています。モデルの問題ではなく、時間の問題になります。

反復テストと自己改善のループを使うことで、私は一定時間動かしたときに、Qwen 3.5: 9bがClaude codeと同じくらい有用であることを見つけました。コードを提案し、作り、テストし、うまくいったか確認し、編集し、そして無限に繰り返します。

どのように自己書き換えするのか:

このシステムは24時間365日動作します。タスクが与えられていないときは、このシステムが動くためのファイルをレビューし、改善案を提案し、全エージェントによる2/3の多数決(の結果)を得た後に、サンドボックス環境内でそれらの改善または自己拡張を自律的に実装します。

自己書き換えは、ある程度カスタマイズ可能です。たとえば、あなた自身のために別タイプのシステムが欲しいかもしれません。その場合は、一定の「アンカーとなる状態」を用意し、あとは彼らがそれぞれの時間の中で常に最終目標へ向かって進んでいくようにします。設計上、このシステムを使う人は皆、(おそらく)異なるバージョンになります。変更内容は、その特定のエージェントが達成したいことに依存するためで、二つとして同じものになりません。エージェントは一連の制約に基づいて作られ、その制約では同じエージェントが二度と生成されないようになっています(少なくとも私が見た限りはそうです。ただし一部の振る舞いは普遍的です)。

HOLLOWは2つの重要な問題を解決します:

A. 本当に「開発しているように」ではなく、本当に開発することを可能にします。

B. 人間の介入なしで(望むのであれば別ですが)、時間の経過とともにシステムとして自らを本当に発展させ、学習し適応させることを可能にします。

この過去1か月で74のGitHubスターと数百人のテスター、本当にありがとうございます。サポートには心底驚かされました。これは開発途中ですが、何かフィードバック、批判、あるいは共有したい成功例があれば、ぜひ下にコメントしてください!

submitted by /u/TheOnlyVibemaster
[リンク] [コメント]