Edu-MMBias: A Three-Tier Multimodal Benchmark for Auditing Social Bias in Vision-Language Models under Educational Contexts
arXiv cs.AI / 4/14/2026
💬 OpinionSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- Edu-MMBiasは、教育文脈でVision-Language Models(VLMs)の社会的バイアスを監査するための3階層(認知・情動・行動)ベースのマルチモーダル・ベンチマーク/監査フレームワークを提案している。
- 現行の評価がテキスト中心で視覚モダリティのバイアスを見落としがちだという課題を踏まえ、視覚入力がテキストのアラインメント対策を回避する可能性(安全上の“バックドア”)を検証対象に含めている。
- 自己修正メカニズムとhuman-in-the-loop検証を組み込んだ生成パイプラインにより、汚染に強い学生プロファイルを合成してVLMに対するストレステストを行う。
- 実験では、低ステータスの語りを好む補償的なクラスバイアスが見られる一方、健康や人種に関するステレオタイプが深層に残っているなど、直感に反するパターンが報告されている。
- 視覚入力によってテキストベースのアラインメント保護が再び無効化される現象と、潜在的な認知と最終決定のミスアラインが示唆されている。


