GO-GenZip: 目標指向の生成AI駆動サンプリングとハイブリッド圧縮

arXiv cs.LG / 2026/3/23

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文 GO-GenZip は、観測すべき内容とネットワークテレメトリデータのエンコード方法を同時に最適化する、GenAI駆動のサンプリングとハイブリッド圧縮フレームワークを提案する。
  • 適応的マスキングとタスク関連性を用いて選択的データ収集を導き、データ量を削減しつつ下流の分析精度を維持する。
  • 従来の無損失符号化と GenAI 駆動の有損圧縮を組み合わせることで、再構成精度とタスク性能を維持する。
  • 実ネットワークデータセットを用いた実験で、再構成と分析の忠実度を保ちながら、サンプリングとデータ転送コストを50%以上削減できることが示され、実用性が高いことを示している。

要旨:現在のネットワークデータテレメトリパイプラインは、複数の分散ソースから中央の集約点へ向かう高度に細分化された主要パフォーマンス指標(KPI)の巨大なストリームで構成され、データの保存、伝送、およびリアルタイム分析をますます持続不可能にしている。本研究は、GenAI(生成型AI)駆動のサンプリングとハイブリッド圧縮フレームワークを提示し、目標指向の視点からネットワークテレメトリを再設計する。従来のアプローチが完全に観測されたデータを受動的に圧縮するのとは異なり、私たちのアプローチは、下流タスクへの情報の関連性に基づいて、何を観測するかとどのようにエンコードするかを共同で最適化する。フレームワークは、適応的マスキング技術を用いた適応サンプリングポリシーを、生成モデリングと組み合わせて、時空間的次元を横断するパターンを識別し、重要な特徴を保持する。選択的に取得されたデータは、従来のロスレス符号化とGenAI駆動の損失を伴う圧縮を組み合わせたハイブリッド圧縮方式でさらに処理される。実データセットを用いた実験結果は、サンプリングとデータ転送コストを50%以上削減しつつ、下流タスクにおける再構成精度と目標指向の分析忠実度を比較可能な水準で維持することを示している。