[D] オープンワールドっぽい学習問題の定義を探しています

Reddit r/MachineLearning / 2026/3/27

💬 オピニオンIdeas & Deep Analysis

要点

  • 推論時に、学習中に十分カバーされていなかったより大きなクラス集合を扱うため、約30のターゲットクラスで学習されたモデルが必要だった。
  • 通常のクローズドセット分類の代わりに、著者はメトリック学習(ArcFace/CosFace系の適応)を用いて、同一クラス内のコサイン類似度を低減しクラス間距離を大きくする埋め込み空間を学習した。
  • 推論時には、類似度を計算し、しきい値の上下でクラスタリングを行うことでオブジェクトを割り当てた。各クラスタがターゲットクラスに対応すると仮定している。
  • この手法は、学習中にモデルが見ていなかったクラスにも良く汎化したと報告されており、著者はこの問題設定が何と呼ばれるのかを尋ねている。
  • 著者はそれを「open-world-ish(オープンワールドっぽい)」と述べているが、一般的なOOD検出ではない。理由は、すべてをラベル「unknown(未知)」として扱うのではなく、クラスタリングするためである。

こんにちは!

最近、私はあるプロジェクトをやっていて、最初は約30のターゲットクラスを用意していました。しかし推論の段階では、モデルが学習データ内のこれら30個のターゲットクラスよりもはるかに多いクラスを扱える必要がありました。したがって、30個のターゲットクラスのどれか1つを予測するだけの、いわゆる「通常の」分類器を作るだけでは不可能でした。

そこで私は、メトリック学習のアプローチを採用しました。arcface/cosface などのさまざまな派生を調整して、コサイン間距離を最大化し、コサイン内距離を最小化しようとする埋め込み空間を作りました。

推論時には、次に類似度のしきい値を設定して、それに応じてオブジェクトをクラスタリングしました。もちろん、そのクラスタを形成したオブジェクトは同じターゲットクラスに属するはずだ、というのが狙いです。

そして驚くほど、学習中にモデルが一度も見たことのないクラスに対しても上手く機能しました。

そこで質問です:こういう種類のMLは何と呼ばれるのでしょうか?自分の認識では、クラスタリングしているのでOOD検出(out-of-distribution detection)というわけではなく、また「未知」として分類しているわけでもありません。

submitted by /u/ralfcat
[link] [comments]
広告