AgentPack: A Dataset of Code Changes, Co-Authored by Agents and Humans
arXiv cs.CL / 3/30/2026
💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- AgentPackは、Claude Code・OpenAI Codex・Cursor Agentが人間と共同で行った1.8M件のコード編集を集めたコーパスで、GitHub上の公開リポジトリ(2025年10月初旬まで)を対象にしています。
- 従来の学習データはコミットメッセージの短さや複合的な変更、ボット由来のノイズなどで質に課題がありましたが、エージェント共同編集では意図や理由を自然言語でより明確に残しやすい点が利点として示されています。
- 公開リポジトリでの取り込み段階ではメンテナが低品質な変更を除外することで、間接的な品質フィルタが働く可能性が論じられています。
- 論文ではAgentPackの識別・キュレーション手順やエージェント採用トレンド、編集の構造的性質を分析し、AgentPackで微調整したモデルが従来の人間のみのコミット学習に比べて性能向上することを報告しています。
Related Articles

Black Hat Asia
AI Business

Mr. Chatterbox is a (weak) Victorian-era ethically trained model you can run on your own computer
Simon Willison's Blog
Beyond the Chatbot: Engineering Multi-Agent Ecosystems in 2026
Dev.to

I missed the "fun" part in software development
Dev.to

The Billion Dollar Tax on AI Agents
Dev.to