BoSS: 深層アクティブラーニングのオラクルとしての戦略ベストセレクター

arXiv cs.LG / 2026/3/16

📰 ニュースModels & Research

要点

  • BoSS は、深層アクティブラーニングのためのスケーラブルなオラクル戦略として提案されており、選択戦略のアンサンブルから候補バッチを構築し、予測される性能向上が最も大きいバッチを選択します。
  • このアプローチは、モデル・アノテーション予算・データセット全体に対してロバスト性を追求しており、実務上利用できない真理情報に依存する既存のアクティブラーニング戦略の弱点に対処します。
  • 実験結果は BoSS が既存のオラクル戦略を上回ることを示すとともに、現在の最先端のアクティブラーニング手法は依然としてオラクルの性能に及ばず、特に多クラスを持つ大規模データセットで顕著である。
  • BoSS は容易に拡張可能です。新しい選択戦略をアンサンブルに追加でき、アンサンブルは複数の戦略を活用することでアクティブラーニングの性能のばらつきを自然に緩和します。

要約: アクティブ・ラーニング(AL)は、価値のあるインスタンスを反復的に選択することにより、アノテーションコストを削減しつつモデルの性能を最大化することを目的としています。基盤モデルはこれらのインスタンスを特定するのを容易にしていますが、既存の選択戦略は異なるモデル、アノテーション予算、データセット間でロバスト性に欠けます。既存のAL戦略の潜在的な弱点を浮き彫りにし、研究の参照点を提供するために、オラクル戦略を探ります。すなわち、実務的なALシナリオでは利用できない正解データの情報にアクセスして最適な選択を近似する戦略、すなわちオラクル戦略です。現在のオラクル戦略は、しかしながら、大規模なデータセットや複雑な深層ニューラルネットワークに対して効果的にスケールすることができません。これらの制限に対処するために、大規模なALシナリオを想定して設計されたスケーラブルなオラクル戦略である Best-of-Strategy Selector(BoSS)を導入します。BoSSは、選択戦略のアンサンブルを通じて候補バッチのセットを構築し、最大の性能向上をもたらすバッチを選択します。選択戦略のアンサンブルとして、BoSSは新しい最先端戦略が出現するにつれて容易に拡張でき、将来も信頼できるオラクル戦略であり続けます。我々の評価は、i) BoSSが既存のオラクル戦略を上回ること、ii) 最先端のAL戦略は依然としてオラクルの性能に著しく及ばないこと、特に多クラスを含む大規模データセットで、iii) AL戦略の一貫性のない性能に対抗する1つの可能な解決策は、選択のためにアンサンブルベースのアプローチを採用することかもしれない、ことを示しています。