要旨: 希少疾患はしばしば小児において特徴的な顔貌表現型として現れ、臨床医やAI支援のスクリーニングシステムにとって貴重な診断手がかりを提供します。しかし、この分野の進展は、倫理的に調達された顔データが希少で、さらに異なる疾患間で表現型が高度に類似していることによって、深刻に制限されています。これらの課題に対処するために、RDFaceを導入します。RDFaceは、103の希少な遺伝性疾患にまたがる456枚の小児の顔画像から成る、キュレーション済みのベンチマークデータセットです(疾患あたり平均4.4サンプル)。各倫理的に検証された画像には、標準化されたメタデータが対応付けられています。RDFaceにより、現実の低データ制約のもとでの希少疾患診断に向けた、データ効率の高いAIモデルの開発と評価が可能になります。私たちは交差検証を用いて複数の事前学習済み視覚バックボーンをベンチマークし、DreamBoothおよびFastGANによる合成データ拡張も検討します。生成画像は、表現型の忠実性を維持するために顔のランドマーク類似度でフィルタリングされ、実データと統合されます。その結果、超低データ領域において診断精度が最大13.7%向上します。意味的妥当性を評価するために、実画像と合成画像から視覚言語モデルが生成した表現型記述は、レポート類似度スコア0.84を達成します。RDFaceは、公平な希少疾患AI研究のための、透明でベンチマークに適したデータセットを確立し、診断性能と合成医用画像の完全性の両方を評価するための、拡張可能な枠組みを提示します。
RDFace:極端なデータ不足下における希少疾患の顔画像解析のためのベンチマークデータセットと、表現型を考慮した合成生成
arXiv cs.CV / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文では、倫理的に検証された各画像ペアに対して標準化されたメタデータを整備することで、極端なデータ不足に対応する、103の希少な遺伝的疾患にわたる小児の顔画像456枚からなる厳選ベンチマークデータセット「RDFace」を紹介する。



