類似性・非類似性とペアワイズ比較からの学習

arXiv cs.LG / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、インスタンスレベルのラベル取得が難しい二値分類を、インスタンス間の相対判断を用いた弱教師あり学習として扱うSD-Pcomp分類を提案する。
  • Similarity/Dissimilarity(SD)ラベルと Pairwise Comparison(Pcomp)ラベルの2種類の弱ラベルを活用し、両者の関係をモデリングした2つの無偏推定量を導出する。
  • SDとPcompの凸結合と、それらを統合する統一推定量を通じて、単一の弱ラベルを用いる手法より分類性能を改善し、ノイズやクラス事前確率推定の不確実性に対して頑健性を示す。
  • 理論的解析と実験結果により、提案手法が単一弱ラベル手法より高性能で、実世界のラベルノイズや不確実性に対して安定性を発揮することを示している。

Abstract

本論文は、インスタンス対に定義された複数の弱いラベルを利用することによって、明示的なインスタンスレベルのラベルの取得が現実的でない状況における2値分類に対処する。既存の SconfConfDiff 分類フレームワークは、連続値の確率的監督を含み、類似性の信頼度、クラス一致の確率、および陽性クラス確率の差である confidence-difference を含む。しかし、確率的ラベル付けには主観的な不確実性の定量化が必要であり、しばしば不安定な監督につながる。我々は SD-Pcomp 分類を提案します。これは相対的判断のみに依存する2値の判断に基づく弱教師あり学習フレームワークで、2つのインスタンス間のクラス一致と陽性クラスへのペアワイズの好みによるものです。手法は Similarity/Dissimilarity (SD) ラベルと Pairwise Comparison (Pcomp) ラベルを採用し、2つの無偏リスク推定量を開発します。(i)SDとPcompの凸結合、(ii)それらの関係をモデリングして両方のラベルを統合する統一推定量。理論解析と実験結果は、提案手法が単一の弱いラベルを用いる方法よりも分類性能を向上させ、ラベルノイズやクラス事前推定の不確実性に対して頑健であることを示しています。