「欠け」が「構造」になるとき：金融KOLの議論から意図を保持したポリシー補完

arXiv cs.LG / 2026/4/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、金融KOL（Key Opinion Leader）のSNS投稿に見られる欠落がランダムではなく、意図の表明（何を買う／売るか、そしてなぜか）は示しつつ、実行判断（いつ、どれくらい、どのくらいの期間）を体系的に未指定にする「構造」を持つと主張しています。
提案手法は、KOLの言説を部分的な取引ポリシーとして扱い、意図は変えずに未指定の実行判断を補完するためにオフライン強化学習を用いる「意図を保持したポリシー補完」枠組みです。
実験では、YouTubeとX（2022〜2025）のマルチモーダルなKOLコンテンツを用い、提案手法（KICL）が両プラットフォームで最良のリターンとシャープレシオを達成したと報告されています。
手法は、未裏付けのエントリがゼロで、かつ方向性の反転もゼロの状態を維持しつつ、アブレーション結果として意図整合のベースラインに対してリターンが18.9%改善したことが示されています。

要旨: ソーシャルメディアにおける主要意見リーダー（KOL）の言説は、投資の指針として広く消費されているが、未指定の実行判断に関する仮定を一切注入せずに、それを実行可能なトレーディング戦略へと変換することは、未解決の問題である。KOLの発言に見られるギャップは、ランダムな欠損ではなく、構造化された分離であることを観察する。すなわち、KOLは方向性の意図（何を買うか／売るか、そしてなぜか）を表明する一方で、実行の判断（いつ、どれだけ、どれくらいの期間）は体系的に未指定のままにしている。この観察に基づき、KOLの言説を部分的なトレーディング方策として扱い、オフライン強化学習を用いて、KOLが示した意図の周りに存在する欠落した実行判断を補完する、意図を保持する方策完結フレームワークを提案する。YouTubeおよびX（2022-2025）のマルチモーダルなKOL言説に関する実験では、KICLが両プラットフォームにおいて最良のリターンおよびシャープレシオを達成しつつ、未支持のエントリがゼロであり、方向性の反転がゼロであることを維持する。また、アブレーションにより、完全なフレームワークがKOL整合ベースラインに対して18.9%のリターン改善をもたらすことが確認される。