Cornserve: 任意対任意のマルチモーダルモデル向けの分散サービングシステム
arXiv cs.LG / 2026/3/13
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- Cornserveは、汎用のAny-to-Anyマルチモーダルモデル向けの分散サービングシステムであり、計算グラフを表現する柔軟なタスク抽象化を可能にし、独立したスケーリングを前提としたコンポーネントのディスアグリゲーションをサポートします。
- ランタイムはデータ依存関係を管理するためにレコード・アンド・リプレイ実行モデルを使用し、テンソルデータを生成元から直接消費者へ転送し、必要に応じてデータプレーンに計算をディスパッチします。
- Kubernetes上に構築され、約23,000行のPythonコードから成る。これにより、さまざまなAny-to-Anyモデルをサポートし、最大で3.81倍のスループット向上と5.79倍のテールレイテンシ低減を実現します。
- Cornserveはオープンソースで、デモ動画はYouTubeで公開されています。
要旨: Any-to-Anyモデルは、入力としてテキスト、画像、動画、音声などのマルチモーダルデータの組み合わせを受け取り、それらを出力として生成する新興のマルチモーダルモデルの一種です。これらのモデルを提供することは難しく、入力モダリティと出力モダリティが異なるさまざまなリクエストは、モデル計算グラフを通って異なる経路を辿り、それぞれのコンポーネントは異なるスケーリング特性を持っています。われわれは、汎用のAny-to-Anyモデル向けの分散サービングシステムであるCornserveを紹介します。Cornserveは、Any-to-Anyモデルの計算グラフを表現するための柔軟なタスク抽象化を提供し、コンポーネントのディスアグリゲーションと独立したスケーリングを可能にします。分散ランタイムは、データ依存関係を追跡する効率的なレコード・アンド・リプレイ実行モデルを介してデータプレーンに計算をディスパッチし、テンソルデータを生成元から消費者へ直接コンポーネント間で転送します。Kubernetes上に構築され、約23,000行のPythonコードを用いて構築されており、CornserveはさまざまなAny-to-Anyモデルをサポートし、最大で3.81倍のスループット向上と5.79倍のテールレイテンシ低下を実現します。Cornserveはオープンソースで、デモ動画はYouTubeで公開されています。