AIエージェントの壊れたcronジョブをLLMで自動修復する仕組みを作った
Zenn / 2026/4/28
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage
要点
- AIエージェントが壊れたcronジョブを検知し、原因解析と修復案の生成をLLMで行う仕組みを構築した。
- 自動修復は単なる再実行ではなく、ジョブの失敗内容や前提情報をもとに修正を提案・適用することで自己回復(self-healing)を狙っている。
- 既存の運用フローに組み込める形で「壊れたまま放置される」問題を減らし、運用負荷と復旧時間の短縮を目指している。
- LLMの出力を実運用へ反映する際の安全性や検証(誤修復防止)を前提にした設計が重要になる。
- 実装の意義として、LLMを“保守・運用の自動化”へ適用する実例になっている。
TL;DR
38本のcronジョブを常時稼働させているAIエージェントシステムで、28件の complex interpreter invocation エラーが同時多発した。手動修正は不可能なスケールだったため、skill-fixer という自己修復cronを実装した。翌朝には28件→0件に完全解消。この記事ではその設計と実装を解説する。
前提条件
OpenClaw(AIエージェントフレームワーク)を使用
cronジョブでスキルを定期実行している
Node.js / bun が動作する環境
背景:38本のcronが50%落ちる地獄
Aniccaは、トレンド収集・コンテン...
この記事の続きは原文サイトでお読みいただけます。
原文を読む →


