概要: オンライン健康コミュニティは、患者同士をピアサポートのために結び付けますが、ユーザはパーソナライズを導くための事前の相互作用がほとんどない場合に、発見(ディスカバリ)の課題に直面します。本研究では、調査(サーベイ)主導の設定において、極端な相互作用の疎(スパース)さのもとでの推薦を扱います。各ユーザは16次元の導入(intake)ベクトルを提供し、各サポートグループは構造化された特徴プロファイルを持ちます。われわれは、行列因子分解(Matrix Factorization)、多層パーセプトロン(Multi Layer Perceptron)、NeuMF などのニューラル協調フィルタリング(Neural Collaborative Filtering)アーキテクチャを拡張し、サーベイのグループ特徴のアラインメントに基づく補助的な擬似ラベル目的を、コサイン類似度を [0, 1] に写像して導出する形で追加します。その結果得られる Pseudo Label NCF は、二つの埋め込み空間を学習します。すなわち、ランキング用の主埋め込みと、意味的アラインメント用の擬似ラベル埋め込みです。
切り離し(leave one out)プロトコルを用いて評価を行います。これはコールドスタート条件を反映しています。165人のユーザと498のサポートグループからなるデータセットを用いました。擬似ラベルの各バリアントはいずれもランキング性能を改善します。MLP は HR@5 を 2.65% から 5.30% に改善し、NeuMF は 4.46% から 5.18% に改善し、MF は 4.58% から 5.42% に改善しました。また、擬似ラベルの埋め込み空間は、ベースライン埋め込みよりも高いコサイン・シルエットスコアを示します。MF は 0.0394 から 0.0684 に、NeuMF は 0.0263 から 0.0653 に改善しました。さらに、埋め込みの分離可能性とランキング精度の間には負の相関があることを観察しており、解釈可能性と性能の間にトレードオフが存在することが示唆されます。
これらの結果は、サーベイに由来する擬似ラベルが、極端な疎な状況下での推薦を改善する一方で、解釈可能なタスク固有の埋め込み空間を生成することを示しています。
疎なOHC推薦に対する疑似ラベルNCF:二重表現学習と識別可能性(separability)—精度のトレードオフ
arXiv cs.AI / 2026/3/27
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、相互作用が極端に疎なオンライン・ヘルス・コミュニティにおける推薦を改善するために、「疑似ラベルNCF(Pseudo Label NCF)」を提案する。調査(サーベイ)グループの特徴アラインメントを、コサイン類似度に基づく疑似ラベルとして用いる。
- モデルは、ニューラル協調フィルタリング(MF、MLP、NeuMF)を拡張し、ランキング用と意味的アラインメント用の2つの埋め込み空間を学習する補助的な疑似ラベル目的関数を追加する。
- 165人のユーザと498のサポートグループに対し、leave-one-outのコールドスタート手順を用いた実験の結果、疑似ラベルの派生手法は、検証した全アーキテクチャにおいてランキング性能を改善することが示される。
- 著者らは、疑似ラベルによる埋め込み空間がベースラインよりも高いコサイン・シルエットスコア(識別可能性の向上)を得る一方で、埋め込みの識別可能性とランキング精度が負の相関を示すことから、解釈可能性と性能の間にトレードオフがあることを見出す。
- 全体として、調査に由来する疑似ラベルは、疎な推薦品質を改善できるだけでなく、より解釈可能でタスクに特化した埋め込みを生成し得ることが示唆される。



