アブストラクト: 生成的検索(Generative Retrieval, GR)は、現代の検索システムにとって有望なパラダイムとして登場している。多段のカスケード型アーキテクチャと比べて、エンドツーエンドの共同最適化や高い計算効率といった利点がある。代表的な産業規模で実際に導入・運用されている生成的検索フレームワークであるOneSearchは、大きな商業的および運用上の利益をもたらしてきた。だが、その複雑なクエリの理解が不十分であること、潜在するユーザ意図の活用が非効率であること、そして狭い過去の嗜好に過剰適合してしまうことによって、さらなる性能向上が制限されてきた。これらの課題に対処するために、
\textbf{OneSearch-V2}、すなわち潜在推論を強化した自己蒸留型生成検索フレームワークを提案する。これは、3つの主要な革新を含む。(1)思考を補強した複雑なクエリ理解モジュール。これにより、深いクエリ理解を可能にし、直接推論による浅い意味マッチングの限界を克服する;(2)推論を内部化した自己蒸留の学習パイプライン。ログへの適合(log-fitting)以上の暗黙的なインコンテキスト学習によって、ユーザの潜在的でありながら正確なEC(電子商取引)の意図を掘り起こす;(3)行動嗜好アラインメント最適化システム。単一のコンバージョン指標に起因するリワードハッキングを緩和し、さらに直接のユーザフィードバックによりパーソナルな嗜好に対応する。広範なオフライン評価により、OneSearch-V2の強力なクエリ認識能力とユーザプロファイリング能力が示される。オンラインA/Bテストでも、そのビジネス上の有効性がさらに裏付けられ、アイテムCTRが+3.98\%、購入者コンバージョン率が+3.05\%、注文量が+2.11\%となった。手動評価においても、ページの良好率が+1.65\%、クエリ-アイテム関連度が+1.37\%と、検索体験の品質向上が確認できる。より重要なのは、OneSearch-V2が追加の推論コストや提供遅延(サービング・レイテンシ)を伴うことなく、情報バブルやロングテールのスパース性といった検索システムに典型的な問題を効果的に緩和する点である。
OneSearch-V2:潜在推論を強化した自己蒸留による生成検索フレームワーク
arXiv cs.CL / 2026/3/26
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- OneSearch-V2は、生成的リトリーバルのOneSearchフレームワークを改良する提案であり、複雑なクエリ理解、潜在意図の活用、そして狭い過去の嗜好にとどまらない頑健性の向上を目指している。
- このアプローチでは、思考拡張型のクエリ理解モジュール、精密なEC(電子商取引)インテントを掘り起こすための推論内部化自己蒸留の学習パイプライン、ならびに単一指標の最適化に起因する報酬ハッキングを抑える行動嗜好アライメント(整合)システムを導入する。
- オフライン実験では、クエリ認識とユーザープロファイリング品質で大きな改善が報告されており、オンラインのA/Bテストでは、事業面での定量的な向上が示されている(+3.98%のアイテムCTR、+3.05%の購入者転換、+2.11%の注文量)。
- 手動評価では、ユーザー向け検索品質の改善(+1.65%のページ良好率、+1.37%のクエリ-アイテム関連度)が示される。さらに、この手法は推論コストやレイテンシを増やすことなく、情報バブルやロングテールの疎性といった問題の軽減にもつながると報告されている。
- 全体として、本論文はOneSearch-V2を、推論時のより重いモデル変更ではなく、効率を意識した学習中心の生成検索改善として位置づけている。