エピステミック・ブラインディング:LLM支援解析における事前知識(プリオール)汚染を監査するための推論時プロトコル

arXiv cs.AI / 2026/4/8

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文では、「エピステミック・ブラインディング」を、LLM支援による解析を監査する手法として位置づける。すなわち、モデルの学習時の事前知識(プリオール)がプロンプトで与えられたデータに静かに混ざり込み、その出力がどの情報源に由来するのか判別できなくなる状況を問題視する。
  • 推論時プロトコルとして、エンティティ識別子を匿名のコードに置き換えたうえで、その結果を「非ブラインド(対照)実験」と比較し、事前知識の汚染度合いを推定する方法を提案する。
  • 腫瘍学の創薬・標的優先順位付けシステムでは、ブラインドによりトップ20予測のうち16%が変化する一方で、検証済みの標的は回収できており、重要な知見を損なうことなく監査可能性が向上することを示唆している。
  • 汚染問題は生物学に限らない一般性を持つことが示される。S&P 500の株式スクリーニングでは、ブランド認知バイアスが複数回の実行にわたってトップ20のランキングの30〜40%に影響する。
  • 導入を後押しするため、著者らはオープンソースのツールと、エージェント型ワークフローでワンコマンドでエピステミック・ブラインディングを可能にするClaude Codeのスキルを公開する。