要約: 実務において、機械学習の手法は入力をフィルタリングしたり、分布シフトを検出するために異常検知(AD)を一般的に必要とします。通常、これは主要モデルと並行して別のADモデルを実行することで実装されます。しかし、この分離は、主要モデルがすでにターゲット分布に関するかなりの情報をエンコードしているという事実を見落としています。本論文では、On-Model AD を導入します。これは関連する機械学習モデルへのアクセスを明示的に活用する異常検知の設定です。この設定の下で、主要モデルから導出されたニューロンごとの出力範囲を利用するアルゴリズムとして RangeAD を提案します。RangeAD は高次元のタスクにおいても優れた性能を発揮し、推論コストを大幅に低く抑えます。我々の結果は、On-Model AD 設定が効率的な異常検知の実用的なフレームワークとなる可能性を示しています。
RangeAD: 高速なオンモデル異常検知
arXiv cs.LG / 2026/3/19
📰 ニュースModels & Research
要点
- RangeADはオンモデルADを導入し、主モデルのニューロンごとの出力範囲を活用して、別個のADモデルを用いずに異常検知を行います。
- 提案されたRangeADアルゴリズムは、高次元タスクにおいて優れた性能を発揮しつつ、推論コストを大幅に削減します。
- 異常検知を主モデルに統合することで、RangeADはデータ分布のシフトを監視する、より効率的でスケーラブルなアプローチを実現します。
- 本論文は、実世界の機械学習システムにおける効率的な異常検知のための実用的なフレームワークとして、オンモデルADを位置づけている。
関連記事
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
[P] 自宅PC上の Vibecoded: Karpathyに触発されたAI支援の研究ループを用いて、約2700 Elo のブラウザでプレイ可能なニューラルチェスエンジンを構築
Reddit r/MachineLearning
DuckLLM 1.0 — 私の初めてのモデルを紹介します!
Reddit r/LocalLLaMA
FastFlowLMがLinux対応を追加したため、同社がサポートする全モデルをベンチマークしました。以下が結果です。
Reddit r/LocalLLaMA
高次元生存分析におけるネストしたモデルと非ネストモデルを比較する際に用いる評価指標は何ですか [D]
Reddit r/MachineLearning