ICLAD:監視レジームを横断する統一的な表形式データの異常検知のためのインコンテキスト学習

arXiv cs.LG / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • ICLAD は、データセットを横断し、3つの監視レジーム(ワン・クラス、完全無監督、および半教師あり)を横断して一般化する、表形式データの異常検知のためのインコンテキスト学習ファウンデーションモデルを提案する。
  • このモデルは、合成の表形式データ異常検知タスクを用いたメタ学習で訓練され、推論時にはモデルの重みを更新せず、訓練データを条件づけすることで異常スコアを割り当てる。
  • ADBench の57 の表形式データセットを用いた評価は、すべての監視レジームで最先端の性能を示し、表形式データの異常検知のための統一的なフレームワークを確立した。
  • 本研究は、タスク横断で共有される構造が、実用的な異常検知シナリオにおいて、さまざまな監督レベルおよびデータレジームに応じた柔軟な展開を可能にすることを示している。

要旨: 表形式データの異常検知は、通常、以下の3つの監視設定の下で研究される。異常なしの訓練サンプルにアクセス可能であることを前提とする1クラス設定、ラベルなしで潜在的に汚染された訓練データを含む完全に教師なし設定、そして限られた異常ラベルを持つ半教師付き設定。既存の深層学習アプローチは通常、単一の監視レジームを前提としてデータセット特有のモデルを訓練する。そのため、異常検知タスク間の共有構造を活用したり、異なる監視レベルに適応したりする能力が制限される。我々はICLAD、表形式データの異常検知のためのインコンテキスト学習基盤モデルを提案する。ICLADはデータセット間および監視レジーム間の一般化を実現する。ICLADは合成表形式データの異常検知タスクに対するメタ学習を介して訓練され、推論時には訓練データに条件付けすることによって異常スコアを割り当て、モデルの重みを更新しない。ADBenchの57の表形式データセットを対象とした包括的な実験により、我々の手法は3つの監視設定すべてで最先端の性能を達成し、表形式データの異常検知の統一的なフレームワークを確立した。