LLMによるインコンテキスト分子特性予測:記憶と知識の競合に関する盲検研究
arXiv cs.LG / 2026/3/30
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、LLMが本当にインコンテキスト分子特性回帰を実行しているのか、それとも主に記憶(memorization)に依存しているのかを調べ、ベンチマーク汚染への懸念に対処する。
- 事前学習された知識の効果とインコンテキスト例の効果を切り分けるため、アクセス可能な情報量を段階的に減らしていく漸進的な盲検(blinded)実験を行う。
- GPT-4.1、GPT-5、Gemini 2.5ファミリの9つのLLMバリアントを、3つのMoleculeNetデータセット(Delaney溶解度、リポフィリシティ、QM7原子化エネルギー)で評価する。
- 実験では、提供するコンテキスト量が性能や潜在的な記憶挙動にどう影響するかを検証するため、インコンテキストのサンプルサイズを制御した(0-shot、60-shot、1000-shot)設定を含める。
- 著者らは、情報アクセスを制御したもとでの分子特性予測を評価するための原理に基づいた評価フレームワークを提案し、事前学習とインコンテキスト学習の間に生じる競合を可視化する。




