プロンプトエンジニアリングによるマルチエージェントコード生成のTDDガバナンス

arXiv cs.AI / 2026/4/30

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、LLMがソフトウェア開発を加速する一方で、不安定性や非決定性が生じやすく、制約のないワークフローでは開発規律を守れない場合があると主張しています。
  • そこで、古典的なTDD(Red-Green-Refactor)を、構造化されたプロンプトレベルおよびワークフローレベルの制約として“執行可能なガバナンス”に落とし込むAIネイティブな枠組みを提案します。
  • 抽出した原則は機械可読な「マニフェスト」として形式化され、計画、コード生成、修正(repair)、検証(validation)の各段階にわたって適用されます。
  • 位相の順序付け、修正ループ回数の上限、検証ゲート、原子的なコード変更の制御を行うことで、安定性と再現性の向上を狙います。
  • 著者らはアーキテクチャを示し、ソフトウェア工学上の規律をプロンプトオーケストレーションに埋め込むことが、信頼性の高いLLM支援開発につながる可能性があると述べています。

概要: 大規模言語モデル(LLM)はソフトウェア開発を加速しますが、多くの場合、不安定性、非決定性、そして制約のないワークフローにおける開発規律への弱い遵守といった問題を示します。テスト駆動開発(TDD)は、レッド-グリーン-リファクタの構造化されたプロセスを提供しますが、既存のLLMベースのアプローチは通常、テストを補助入力として用いる一方で、実行可能なプロセス制約として強制することはありません。私たちは、古典的なTDDの原則を、構造化されたプロンプト・レベルおよびワークフロー・レベルの統治メカニズムとして実装する、AIネイティブなTDDフレームワークを提案します。抽出した原則は機械可読なマニフェストとして形式化され、階層化アーキテクチャの中で、モデル提案と決定論的なエンジン権限を分離しつつ、計画、生成、修復、検証の各段階に分散して配置されます。このシステムは、段階の順序付け、修復ループの上限、検証ゲート、そして原子的なミューテーション制御を強制することで、安定性と再現性を向上させます。私たちはアーキテクチャを説明し、プロンプト・オーケストレーションへソフトウェア工学の規律を直接エンコードする方法について議論します。これは、信頼性の高いLLM支援開発に向けた有望な方向性を提供すると考えています。