MiroThinker-1.7 および H1: 検証による堅牢な研究エージェントを目指して

arXiv cs.CL / 2026/3/18

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

MiroThinker-1.7 は、複数ステップのタスクにおける信頼性を高めるために、構造化された計画、文脈推論、ツールとの連携を導入します。
MiroThinker-H1 は、局所レベルとグローバルレベルの検証を追加し、中間の意思決定を評価し、最終回答の一貫性と根拠の裏付けを監査できるようにします。
オープンウェブ研究、科学的推論、金融分析のベンチマーク全体で、MiroThinker-H1 は深い研究タスクにおいて最先端の性能を達成します。
本プロジェクトは、効率性の向上を強調する、オープンソースのモデル MiroThinker-1.7 および MiroThinker-1.7-mini も公開します。

要約: 複雑で長期の推論タスクのために設計された新しい研究エージェント、MiroThinker-1.7を紹介します。基盤を土台として、より信頼性の高い多段階の問題解決のためにエージェントを拡張する重厚な推論能力を備えた MiroThinker-H1 をさらに導入します。特に、MiroThinker-1.7 は、構造化された計画、文脈的推論、およびツールとの相互作用を強調するエージェント的な中間トレーニング段階を通じて、各相互作用ステップの信頼性を向上させます。これにより、複雑なタスク全体にわたるより効果的な多段階の相互作用と継続的な推論が可能になります。MiroThinker-H1 は、局所レベルとグローバルレベルの両方で推論プロセスに直接検証を組み込むことができます。中間的な推論の決定は推論中に評価・洗練される一方、全体の推論軌道は監査され、最終的な回答が一貫した証拠の連鎖によって裏付けられることを保証します。オープンウェブの研究、科学的推論、金融分析を含むベンチマーク全体で、MiroThinker-H1 は深い研究タスクにおいて最先端の性能を発揮し、専門分野でも優れた結果を維持します。私たちはまた、MiroThinker-1.7 および MiroThinker-1.7-mini をオープンソースモデルとして公開し、効率を大幅に改善した競争力のある研究エージェント機能を提供します。返却形式: {"translated": "翻訳されたHTML"}