EVE:地球インテリジェンスのためのドメイン特化型LLMフレームワーク

arXiv cs.AI / 2026/4/16

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

要点

  • 本論文では、地球インテリジェンス向けのドメイン特化型LLMを開発・デプロイすることを目的とした、オープンソースのエンドツーエンド・フレームワーク「Earth Virtual Expert(EVE)」を紹介する。
  • 「EVE-Instruct」は、Mistral Small 3.2 をベースにした24Bのドメイン適応モデルとして提示されており、推論と質問応答に最適化されている。
  • 新たな「地球観測」および「地球科学」ベンチマークが報告されており、EVE-Instructは、一般的な能力を維持しながら、同等のモデルよりも高い性能を示す。
  • 本構想には、厳選された学習コーパスと、MCQA(複数選択式質問応答)、自由形式のQA、事実性(ファクト性)にまたがる体系的な評価ベンチマークが含まれており、統合されたRAGとハルシネーション検出の本番パイプラインも備えている。
  • 著者らは、モデル・データセット・コードをHugging FaceおよびGitHubを通じてオープンライセンスで公開すると述べている。さらに、API/GUIを用いたデプロイは、これまでに350人のパイロットユーザーに利用されていると報告している。

Abstract

本稿では、地球インテリジェンス向けのドメイン特化型LLMを開発・展開するための、最初のオープンソースのエンドツーエンド・イニシアチブであるEarth Virtual Expert(EVE)を紹介します。その中核は、Mistral Small 3.2 を土台に構築され、推論と質問応答に最適化された、ドメイン適応済みの24BモデルであるEVE-Instructです。新たに構築したEarth ObservationおよびEarth Sciencesのベンチマークにおいて、一般的な能力を維持しながら、比較可能なモデルを上回ります。厳選した学習コーパスと、MCQA、自由形式のQA、ファクト性をカバーする最初の体系的なドメイン特化型評価ベンチマークを公開します。さらにEVEは、RAGと、幻覚(ハルシネーション)検出のパイプラインを統合し、APIおよびGUIを通じて展開されるプロダクションシステムとして実装しています。これまでに350人のパイロットユーザーをサポートしています。すべてのモデル、データセット、コードは、オープンライセンスのもとで公開する準備が整っており、huggingface.co/eve-esaおよびgithub.com/eve-esaで、私たちの分野への貢献としてリリース可能です。