Gypscie:クロスプラットフォームAIアーティファクト管理システム

arXiv cs.AI / 2026/4/14

💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • Gypscieは、AIモデルのライフサイクル(データ収集・準備、学習、評価、デプロイ、監視)で扱う多様なAIアーティファクトを、クロスプラットフォームで統合管理する仕組みとして提案されています。
  • アプリケーション側の複雑さを隠すため、アーティファクトの意味を表す知識グラフと、データやモデルに対する推論を可能にするルールベースのクエリ言語を提供します。
  • モデルライフサイクルの作業は高レベルのデータフローとして表現され、サーバ、クラウド、スーパーコンピュータなど複数の計算基盤へスケジュール可能にします。
  • 製造・更新されたアーティファクトのプロバナンス(来歴)を記録し、説明可能性(explainability)を支援する点が特徴です。
  • 定性的比較と実験評価により、抽象仕様からデータフローを最適化・スケジューリングできることを示しています。

Abstract

人工知能(AI)モデルは、従来型の機械学習(ML)から、深層学習や大規模言語モデル(LLM)といったより高度なアプローチまでを含み、現代のアプリケーションにおいて中心的な役割を担っています。AIモデルのライフサイクル管理とは、データ収集・準備からモデル構築、評価、デプロイ、継続的な監視に至るまで、これらのモデルをエンドツーエンドで管理するプロセスです。このプロセスは本質的に複雑です。というのも、データセット、データフロー、モデルといったAI成果物を管理する、多様なサービスを調整し、それらがシームレスに動作するようにオーケストレーションする必要があるからです。こうした状況において、異種のサービス、データセット、AIプラットフォームと相互作用する複雑さからアプリケーションを切り離すことが不可欠になります。 本論文では、クロスプラットフォームのAI成果物管理システムであるGypscieを提案します。すべてのAI成果物に対する統一的なビューを提供することで、GypscieはAIアプリケーションの開発およびデプロイを簡素化します。この統一的なビューは、アプリケーションの意味論を捉える知識グラフと、データおよびモデルに関する推論を支援するルールベースのクエリ言語によって実現されます。モデルのライフサイクル活動は、サーバ、クラウドプラットフォーム、スーパコンピュータなど複数のプラットフォームにまたがってスケジュール可能な高レベルのデータフローとして表現されます。最後に、Gypscieは自らが生成する成果物に関するプロベナンス情報を記録するため、説明可能性が可能になります。代表的なAIシステムとの質的比較により、GypscieがAI成果物ライフサイクル全体にわたってより幅広い機能を支えることが示されます。実験的評価では、Gypscieが抽象仕様から、AIプラットフォーム上でデータフローを最適化し、正常にスケジューリングできることを示しています。