AIエージェントの壊れたcronジョブをLLMで自動修復する仕組みを作った

Zenn / 2026/4/28

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

要点

  • AIエージェントが壊れたcronジョブを検知し、原因解析と修復案の生成をLLMで行う仕組みを構築した。
  • 自動修復は単なる再実行ではなく、ジョブの失敗内容や前提情報をもとに修正を提案・適用することで自己回復(self-healing)を狙っている。
  • 既存の運用フローに組み込める形で「壊れたまま放置される」問題を減らし、運用負荷と復旧時間の短縮を目指している。
  • LLMの出力を実運用へ反映する際の安全性や検証(誤修復防止)を前提にした設計が重要になる。
  • 実装の意義として、LLMを“保守・運用の自動化”へ適用する実例になっている。
TL;DR 38本のcronジョブを常時稼働させているAIエージェントシステムで、28件の complex interpreter invocation エラーが同時多発した。手動修正は不可能なスケールだったため、skill-fixer という自己修復cronを実装した。翌朝には28件→0件に完全解消。この記事ではその設計と実装を解説する。 前提条件 OpenClaw(AIエージェントフレームワーク)を使用 cronジョブでスキルを定期実行している Node.js / bun が動作する環境 背景:38本のcronが50%落ちる地獄 Aniccaは、トレンド収集・コンテン...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →