AI Navigate

IQuest-Coder-V1 技術報告書

arXiv cs.AI / 2026/3/18

📰 ニュースIndustry & Market MovesModels & Research

要点

  • IQuest-Coder-V1 ファミリーは、コードLLMs(7B/14B/40B/40B-Loop)と、ソフトウェアパイプラインの進化する論理をモデル化するコードフローの多段階学習パラダイムを導入します。
  • 学習パイプラインには、コード事実、リポジトリデータ、コード補完データに対する初期プレトレーニング、32kコンテキストおよびリポジトリ規模128kコンテキストでの推論とエージェント的軌跡を含む中間学習段階、そして思考経路(推論主導の RL)と指示経路(一般支援)による専門的なコーディング能力を目的としたポストトレーニングフェーズが含まれます。
  • IQuest-Coder-V1-Loop バリアントは、モデル容量とデプロイメントのフットプリントをバランスさせる再帰的機構を追加し、効率重視のデプロイパスを実現します。
  • 著者らは、エージェント的ソフトウェア工学、競技プログラミング、および複雑なツール使用におけるコード知能の最先端性能を主張しています。
  • 彼らは、プレトレーニングベースから最終的な思考モデルおよび指示モデルまでの完全なホワイトボックスチェーン形式のチェックポイントを公開し、自律的なコード知能と実世界のエージェント的システムの発展を目指しています。

要約:本報告では、IQuest-Coder-V1シリーズ(7B/14B/40B/40B-Loop)は、新しいコード大規模言語モデル(LLMs)のファミリです。静的なコード表現を超えて、コードフローのマルチステージ訓練パラダイムを提案します。これは、パイプラインのさまざまな段階を通じたソフトウェア論理の動的な進化を捉えます。私たちのモデルは、初期の事前学習(コード事実、リポジトリ、補完データを含む)から始まる進化的パイプラインによって開発されます。これに続いて、32kコンテキストで推論とエージェント的軌跡を統合し、128kコンテキストのリポジトリ規模で深い論理的基盤を築く、専門的な中間訓練段階を実装します。その後、専門的なコーディング能力を後訓練で最終化し、それは「思考パス」(推論主導のRLを活用)と「指示パス」(一般的な支援向けに最適化)の2つの専門的経路に二分されます。IQuest-Coder-V1は、エージェント的ソフトウェア工学、競技プログラミング、複雑なツールの使用というコード知性の重要な次元において、競合モデルの中で最先端の性能を達成します。デプロイメントの制約に対処するため、IQuest-Coder-V1-Loop バリアントは、モデル容量とデプロイメント・フットプリントのトレードオフを最適化する再帰的機構を導入し、効果と効率のトレードオフのためのアーキテクチャ的に強化された経路を提供します。我々は、プレ訓練基盤から最終的な思考モデルおよび指示モデルまでの完全なホワイトボックス連鎖のチェックポイントを含むIQuest-Coder-V1シリーズのリリースが、自律的なコード知性と実世界のエージェント的システムの研究を前進させると信じています。

返却形式: {"translated": "翻訳されたHTML"}