When Consistency Becomes Bias: Interviewer Effects in Semi-Structured Clinical Interviews
arXiv cs.AI / 3/27/2026
💬 OpinionIdeas & Deep AnalysisModels & Research
Key Points
- 多人数の医師面接データ(ANDROIDS、DAIC-WOZ、E-DAIC、E-DAIC)を分析し、半構造化臨床面接における「面接官プロンプト」が抑うつ/非抑うつの分類に系統的なバイアスを生むことを示している。
- 分類モデルは、面接官の定型フレーズや発話位置などの“台本アーティファクト”を手がかりにして高いスコアを出し得ており、参加者(患者)の言語内容を実質的に使っていない場合がある。
- 面接官ターンを除き参加者発話のみで学習・推論させると、意思決定の根拠がより参加者発話全体に分散され、真に言語的な手がかりを反映しやすくなる。
- このバイアスはデータセット横断・モデル・アーキテクチャに依存しにくく、プロトコルの一貫性が必ずしも“公平な学習”につながらないことを示唆している。
- 今後は時間・話者単位で意思決定の根拠を局所化する分析を行い、モデルが患者の言語から学習していることを検証する必要があると結論づけている。
Related Articles
GDPR and AI Training Data: What You Need to Know Before Training on Personal Data
Dev.to
Edge-to-Cloud Swarm Coordination for heritage language revitalization programs with embodied agent feedback loops
Dev.to
Big Tech firms are accelerating AI investments and integration, while regulators and companies focus on safety and responsible adoption.
Dev.to
AI Crawler Management: The Definitive Guide to robots.txt for AI Bots
Dev.to
Data Sovereignty Rules and Enterprise AI
Dev.to