Intern-S1-Pro:兆規模での科学マルチモーダル基盤モデル

arXiv cs.LG / 2026/3/27

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

要点

  • Intern-S1-Proは、1兆パラメータの科学マルチモーダル基盤モデルとして提示されており、この規模においては初の試みだと主張されています。
  • このモデルは、汎用的な推論と画像・テキスト理解の双方を改善するとともに、高度なエージェント機能も追加するとされています。
  • 科学領域として、化学・材料・生命科学・地球科学にまたがる100以上の専門タスクにまたがる能力があると主張されています。
  • 記事では、1兆パラメータ規模での学習を可能にしている要因としてXTunerおよびLMDeployを挙げ、効率的なRL学習と、学習時と推論時の厳密な精度整合性を強調しています。
  • Intern-S1-Proを「特化可能なジェネラリスト」と位置づけ、最上級のオープンソース汎用性能をうたうとともに、専門的な科学タスクにおいてはプロプライエタリ(非公開)モデルよりも良い結果が得られると主張しています。

Abstract

私たちは、最初の1兆パラメータ規模の科学マルチモーダル基盤モデルであるIntern-S1-Proを紹介します。これまでにない規模へとスケーリングすることで、一般領域と科学領域の両方にわたって包括的な性能向上を実現しています。強化された推論力や画像-テキスト理解能力に加えて、その知能は高度なエージェント能力によって拡張されています。同時に、科学の専門性も大幅に拡張され、化学、材料・物質科学、生命科学、地球科学といった重要な科学分野を含む100以上の専門タスクを習得するに至りました。この巨大なスケールを可能にしているのは、XTunerとLMDeployによる堅牢なインフラ支援であり、トレーニングと推論の間で厳密な精度一貫性を確保しつつ、1兆パラメータ規模で非常に効率的な強化学習(RL)トレーニングを可能にします。これらの進歩をシームレスに統合することで、Intern-S1-Proは一般的な知能と専門的な知能の融合をさらに強固にし、「Specializable Generalist(専門化可能なゼネラリスト)」として機能します。一般能力におけるオープンソース・モデルの上位層に位置することを示すとともに、専門性の高い科学タスクにおいてはプロプライエタリ(専有)モデルをその深さで上回ります。