こんにちは。私は異常検知のセットアップに取り組んでいるのですが、学習の観点からそれを正しくどう説明すればよいのか、少し自信がありません。
モデルは学習時にラベルを使わず、データは1クラス分(正常/良性)のみで学習されます。言い換えると、学習フェーズはクラス同士の区別ではなく、正常な振る舞いのモデル化のみに基づいています。
評価時には、検証セット上で、F1スコアを最大化する値を選ぶことで、意思決定の閾値を設定します。
つまり、表現学習そのものは教師なし(あるいは一クラス)ですが、最終的な決定境界はラベル付きの検証データを用いて選ばれます。
同様のセットアップに対して、異なる用語が使われているのを見かけました。ある情報源ではこれをセミスーパーバイズドと呼んでいますが、別の情報源では、閾値のキャリブレーションを伴う教師なし異常検知として説明しています。
過剰な主張をせずに、この状況を論文では最も正確にどのように記述すべきでしょうか?
[link] [comments]




