生物医学AIにおけるバイアスへの見解:下流の医療格差を防ぐために

arXiv cs.AI / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • この見解は、医療格差につながるバイアスが、臨床導入のはるか前の段階、特に分子レベルでのデータ収集や研究優先順位づけの段階で生じ得ると論じています。
  • 4,719本のPubMed収載オミクス研究(2015〜2024年)を分析した結果、先祖(アンサリ)や民族性を報告する研究はごく一部にとどまり、報告される属性データには大きな偏りがあることが分かりました。
  • 主要な学習用データセット(CellxGeneやGEOなど)を調べたところ、集団間の偏りが大きく、ヨーロッパ系のデータが強く優勢であることが示されています。
  • 生物医学の基盤モデルが、事前学習済みのベースモデルを多様な下流タスクに再利用するパラダイムの中心になるにつれ、こうした初期のデータバイアスが維持・増幅され、規制だけでは十分に逆転できない連鎖的な不公平につながる恐れがあると指摘しています。
  • 著者らは、Provenance(出所の明確化)、Openness(オープン性)、Evaluation Transparency(評価の透明性)の3つの原則をコミュニティ全体で重視することを提案し、生物医学AIの公平性と頑健性の向上を目指しています。