AgentPack：エージェントと人間が共同で行ったコード変更のデータセット

arXiv cs.CL / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

AgentPackは、Claude Code・OpenAI Codex・Cursor Agentが人間と共同で行った1.8M件のコード編集を集めたコーパスで、GitHub上の公開リポジトリ（2025年10月初旬まで）を対象にしています。
従来の学習データは、コミットメッセージの短さや複合的な変更、ボット由来のノイズなどの点で質に課題がありましたが、エージェント共同編集では、意図や理由を自然言語でより明確に残しやすいことが利点として示されています。
公開リポジトリへの取り込み段階では、メンテナが低品質な変更を除外することで、間接的な品質フィルタが働く可能性が論じられています。
論文では、AgentPackの識別・キュレーション手順やエージェント採用トレンド、編集の構造的性質を分析し、AgentPackで微調整したモデルが、従来の人間のみのコミット学習に比べて性能向上することを報告しています。

要旨: コード編集のための大規模言語モデルの微調整は、これまで通常、コミットとプルリクエストを採掘することに依存してきました。作業仮説は、コミットメッセージが自然言語による人間の意図を記述し、コードへのパッチがその意図を実装する変更を記述するというものでした。しかし、これまでに収集されたデータの多くはノイズが多いのが実情です。コミットメッセージは簡潔すぎ、複数の無関係な編集が混在する人間によるコミットが存在し、さらに単純なルールベースのボット由来のコミットも数多く含まれます。
近年のソフトウェアエンジニアリング・エージェントの採用は、この状況を変えつつあります。人間とエージェントによって共同執筆されたコード変更は、多くの場合、意図や根拠に関する、より明示的な自然言語の説明を伴います。加えて、これらの変更が公開リポジトリに取り込まれるとき、人間によって暗黙にフィルタリングされます。すなわち、メンテナはプロジェクトに対する品質の低いコミットを破棄します。
私たちは、2025年10月上旬までの公開GitHubプロジェクトにまたがって、Claude Code、OpenAI Codex、Cursor Agentによって共同執筆された1.8M件のコード編集からなるコーパスであるAgentPackを提示します。私たちは、同定とキュレーションのパイプラインを説明し、これらのエージェントの採用傾向を定量化し、編集の構造的特性を分析します。最後に、AgentPackで微調整されたモデルが、それ以前の人間のみのコミット・コーパスで学習されたモデルを上回ることを示し、将来のコード編集モデルを訓練するために、ソフトウェアエンジニアリング・エージェントから得られる公開データを活用できる可能性を明らかにします。