KAT-Coder-V2 テクニカルレポート
arXiv cs.CL / 2026/3/31
📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- KuaishouのKwaiKATチームが、エージェント型コーディングモデル「KAT-Coder-V2」を発表し、Specialize-then-Unify(専門化→統合)で5つの領域(SWE/WebCoding/Terminal/WebSearch/General)を個別に学習して統合しています。
- それぞれの領域で教師ありファインチューニングと強化学習を行い、最終的にon-policy distillationで単一モデルへ統合する設計が採用されています。
- 大規模並列のサンドボックス実行を支える「KwaiEnv」を開発し、強化学習のスケールをタスク複雑性・意図アラインメント・スキャフォールド一般化に沿って行っています。
- MoE強化学習の安定化(MCLA)や木構造軌道の冗長計算削減(Tree Training)により最大6.2倍の速度向上を示し、複数のベンチマークで高い性能を報告しています。
- SWE-bench Verifiedで79.6%を達成し、モデルは公開(https://streamlake.com/product/kat-coder)されています。




