Adaptive ToR:パレート最適なマルチインテントNLUのための複雑性に応じたツリー型リトリーバル
arXiv cs.AI / 2026/4/28
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 論文では、クエリの難しさに応じて単一ステップと適応的な深さの階層型リトリーバルを動的に切り替える、複雑性に応じたRetrievalアーキテクチャ「Adaptive Tree-of-Retrieval(Adaptive ToR)」を提案する。
- 重み付きの言語的特徴からQuery Complexity Indexを計算する「Query Tree Classifier」を用いて、各クエリを最も効率的なリトリーバル構造へルーティングする。
- 複雑なクエリではサブクエリへ再帰的に分解し、定量的な類似度ゲーティングと意味的関連性評価の2段階フィルタリングによる「Adaptive Pruning」でノードの指数的な増加を抑える。
- デダプ(重複除去)を先に行うパイプラインとグローバルLLMによる再スコアリングで運用効率を高め、NLU++ベンチマークで固定深さベースライン比9.7%の相対改善と大幅な遅延・コスト削減を示す。
- 深さ別分析では、単一ステップのルーティングで短時間に解決できるクエリが多く、深さに応じてトークン消費が増えることから、精度・遅延・計算量のパレート最適なトレードオフを裏付けている。



