LLMはいつ必要になるのか?言語に駆動されるバンディットの診断
arXiv cs.AI / 2026/4/8
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、推薦、ポートフォリオの調整、金融におけるオファー選択などに見られるような、テキストと数値が混在するコンテキストを扱う文脈付き多腕バンディット問題を研究する。ここでは、LLMが段階的な推論にますます用いられている一方で、コストが高く、不確実性に対する較正が難しい。
- 反復推論を実行して不確実性をLLMから抽出し、UCB型の探索を可能にするバンディットアルゴリズムとして、LLMP-UCBを提案する。
- 実験により、テキスト埋め込みを用いた軽量な数値バンディット(denseおよびMatryoshka埋め込みを含む)が、計算コストを大幅に削減しつつ、LLMベースの手法と同等、あるいは上回る性能を達成できることが示される。
- 著者らは、探索と活用のトレードオフを調整可能なレバーとして埋め込み次元を導入し、複雑なプロンプトなしで実用的なコスト—性能のトレードオフを実現できるようにする。
- 腕(アーム)の埋め込みを用いた幾何学的な診断を提示し、実務者が「LLM駆動の推論が本当に必要なのか」それとも「軽量なバンディットに任せればよいのか」を不確実性を踏まえて判断できるようにし、コスト効率のよい導入を目指す。




