要約:本報告では、IQuest-Coder-V1シリーズ(7B/14B/40B/40B-Loop)は、新しいコード大規模言語モデル(LLMs)のファミリです。静的なコード表現を超えて、コードフローのマルチステージ訓練パラダイムを提案します。これは、パイプラインのさまざまな段階を通じたソフトウェア論理の動的な進化を捉えます。私たちのモデルは、初期の事前学習(コード事実、リポジトリ、補完データを含む)から始まる進化的パイプラインによって開発されます。これに続いて、32kコンテキストで推論とエージェント的軌跡を統合し、128kコンテキストのリポジトリ規模で深い論理的基盤を築く、専門的な中間訓練段階を実装します。その後、専門的なコーディング能力を後訓練で最終化し、それは「思考パス」(推論主導のRLを活用)と「指示パス」(一般的な支援向けに最適化)の2つの専門的経路に二分されます。IQuest-Coder-V1は、エージェント的ソフトウェア工学、競技プログラミング、複雑なツールの使用というコード知性の重要な次元において、競合モデルの中で最先端の性能を達成します。デプロイメントの制約に対処するため、IQuest-Coder-V1-Loop バリアントは、モデル容量とデプロイメント・フットプリントのトレードオフを最適化する再帰的機構を導入し、効果と効率のトレードオフのためのアーキテクチャ的に強化された経路を提供します。我々は、プレ訓練基盤から最終的な思考モデルおよび指示モデルまでの完全なホワイトボックス連鎖のチェックポイントを含むIQuest-Coder-V1シリーズのリリースが、自律的なコード知性と実世界のエージェント的システムの研究を前進させると信じています。
返却形式: {"translated": "翻訳されたHTML"}