クラスタリングとロジスティックモデルによるNon-SCAR下でのPU分類の提案
arXiv stat.ML / 2026/4/21
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、SCAR仮定が成り立たない状況でも機能するシンプルなクラスタ洗浄手法を用いたPU(Positive-Unlabeled)分類アプローチを提案している。
- まず2-meansクラスタリングにより「洗浄ラベル」を生成し、その後、洗浄データに対してロジスティック回帰を行い、クラスタリングされた正例を追加の真の正例観測と合わせて正ラベルとして扱う。
- 残りのサンプルは負ラベルとして割り当てられ、洗浄後のPU構造から学習できるようになる。
- 提案手法は、機械学習リポジトリの実データセット11個と合成データで評価され、SCAR違反下でもクラスタリング手順が有効であることを示している。
- さらにロバスト性も検討されており、LassoJoint法はSCAR条件の摂動に対して中程度の頑健性を持つことが示されている。
関連記事

新しいモデルが出るたびに、当然ながら古いモデルは時代遅れになる
Reddit r/LocalLLaMA

NVIDIA DGX SparkフルスタックAIハッカソンで作ったものが総合1位に—『Starfire』から『Molecules AI』へ
Dev.to

進捗を失わない:VS Codeでプロ仕様のJupyterワークフローをセットアップする(Colabのタイムアウトともおさらば!)
Dev.to

AgentOSを作る:保険請求の「AWS Lambda」を目指している理由
Dev.to

状況はここまで来た——1年で何もかも変わった:Kimi、Minimax、Qwen、Gemma、GLM
Reddit r/LocalLLaMA