要旨:
視覚言語モデル(VLM)が教育における意思決定に不可欠になりつつある中で、その公平性を確保することが最重要となっています。しかし、現在のテキスト中心の評価では視覚モダリティが無視されており、潜在的な社会的バイアスが入り込むための未制御の経路が残されています。このギャップを埋めるために、私たちは社会心理学における態度の3構成要素モデルに基づく体系的な監査フレームワーク「Edu-MMBias」を提案します。このフレームワークは、バイアスを3つの階層的次元(認知的・情動的・行動的)にわたって診断します。自己修正メカニズムとhuman-in-the-loop(人間の介在)による検証を組み込んだ専用の生成パイプラインを用いて、汚染に耐性のある学生プロファイルを合成し、最先端のVLMに対する包括的なストレステストを実施します。大規模な監査の結果、重要で直感に反するパターンが明らかになりました。モデルは、低い地位に関する物語を支持する代償的なクラス・バイアスを示す一方で、深く根付いた健康や人種に関するステレオタイプも同時に内包していました。重要な点として、視覚入力が安全性のバックドアとして機能し、テキストベースのアラインメントに対する安全策をすり抜ける形でバイアスが再燃することを私たちは突き止めました。さらに、潜在的な認知と最終的な意思決定の間に、体系的なミスアラインメントが存在することが示されました。本論文の貢献は以下で公開されています: https://anonymous.4open.science/r/EduMMBias-63B2。
Edu-MMBias:教育文脈下におけるVision-Language Models(VLMs)の社会的バイアスを監査するための3階層マルチモーダル・ベンチマーク
arXiv cs.AI / 2026/4/14
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- Edu-MMBiasは、教育文脈でVision-Language Models(VLMs)の社会的バイアスを監査するための3階層(認知・情動・行動)ベースのマルチモーダル・ベンチマーク/監査フレームワークを提案している。
- 現行の評価がテキスト中心で視覚モダリティのバイアスを見落としがちだという課題を踏まえ、視覚入力がテキストのアラインメント対策を回避する可能性(安全上の「バックドア」)を検証対象に含めている。
- 自己修正メカニズムとhuman-in-the-loop検証を組み込んだ生成パイプラインにより、汚染に強い学生プロファイルを合成してVLMに対するストレステストを行う。
- 実験では、低ステータスの語りを好む補償的なクラスバイアスが見られる一方、健康や人種に関するステレオタイプが深層に残っているなど、直感に反するパターンが報告されている。
- 視覚入力によってテキストベースのアラインメント保護が再び無効化される現象と、潜在的な認知と最終決定のミスアラインが示唆されている。



