GLEaN: 公衆の理解のためのテキストから画像へのバイアス検出アプローチ

arXiv cs.AI / 2026/4/14

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • GLEaNは、ポートレートベースで、モデルに依存しないテキストから画像(T2I)のバイアス説明可能性(explainability)を実現するためのパイプラインであり、技術者以外にもT2Iバイアスを理解しやすくすることを目的としている。
  • この手法は、アイデンティティのプロンプトから画像を生成し、顔のランドマークを用いてそれらをフィルタリングおよび整列したうえで、モデルの中心的な傾向を視覚的に要約するメディアン(中央値)ピクセルの合成画像を作成する。
  • 40件のアイデンティティプロンプトに対してStable Diffusion XLを適用したところ、GLEaNは既知のバイアスを再現するだけでなく、皮膚の色と予測される感情の結びつきのような新たな関連性も明らかにした。
  • ユーザー調査(N=291)では、GLEaNのポートレートが、従来の表(テーブル)と同等の効果でバイアスの知見を伝達できる一方で、結果の閲覧と解釈に必要な時間を大幅に削減した。
  • GLEaNは生成された出力のみを用いるため、内部モデルの詳細にアクセスできないブラックボックス環境でも再現可能であり、コードはGitHubで公開されている。