訓練データのバイアスが“変な形”で可視化されていた

Reddit r/artificial / 2026/4/28

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 投稿者は、まったく同じプロンプトで2つの異なる動画生成AIに’90年代の玩具CMを作らせたが、どちらの出力にも女の子が一人も登場しなかった。
  • 出力はプロンプト内容とは無関係に、役柄と人種が一貫した割り当てになっており(例:海賊が黒人の男の子、忍者が東アジアの男の子、スパイが白人の男の子)、投稿者は想定外だったと述べている。
  • 投稿者は、この一致した傾向が学習データに由来するバイアスを反映している可能性を示唆している。
  • 驚きながらも、AIが学習した偏りを出力の形で“見せる”ことがある点が啓発的だったという位置づけである。
  • 最後に、他の人にも有益だろうとして、制御可能なプロンプトでAIを検証する重要性を強調している。

そこで私はこの卓上ロールプレイングゲームのプロジェクトに取り組んでいて、自分の気晴らしに、2つの別々の動画生成AIモデルに
"『90年代のおもちゃのコマーシャル』として、ハロウィーンの仮装をした人種の異なる少年少女が登場し、「『海賊になりたい衝動がある』と言う』『忍者になりたい衝動がある!』と言う(あるいはスパイなど、彼らが着ているのは何であれ)」
それだけ、それがそのままの指示文、という形でプロンプトを渡したんです。そして2つともまったく別の成果物を出してきたんですが、どちらにも少女が一人もいませんでした。さらに両方とも、海賊は黒人の少年、忍者は東アジアの少年、スパイは白人の少年でした。振り返れば理屈としてはまったく筋が通っているんですが、当時は本当に思いもつかず、(自分にとって)いちばん意外だったのは、海賊が黒人の子どもだったことです。ちょっと恣意的に見えるけど、データの中で何かを反映しているに違いありません。とにかく、ちょっと啓発された気分になりました。たぶんあなたもそうかもしれません。じゃあね。

投稿者: /u/Immediate_Tooth4437
[link] [comments]