AnemiaVision:スマートフォン画像によるEfficientNet-B3とTrivialAugmentWide、Mixup拡張、永続的な患者履歴管理で実現する非侵襲的貧血検出

arXiv cs.CV / 2026/4/28

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文では、検査用の採血などのラボ検査が不足しがちな低資源地域を想定し、スマートフォンで撮影したまぶた(眼瞼結膜)と爪床の画像から非侵襲的に貧血をスクリーニングするエンドツーエンドのWebシステム「AnemiaVision」を提案しています。
  • EfficientNet-B3(事前学習済み)をファインチューニングし、BatchNorm・GELU・高率Dropoutを組み込んだ再設計の3層分類ヘッドを用い、TrivialAugmentWide、RandomErasing、Mixup(alpha=0.2)などのデータ拡張と、コサインアニーリング+線形ウォームアップを活用しています。
  • 学習の改善として、検証損失ではなく「ピーク時の検証精度」に基づく精度優先の早期終了ルールを採用し、高分散のエポックでの早すぎる停止を防いでいます。
  • Flaskでのデプロイでは、患者履歴を永続化するためにPostgreSQL(Render)を用い、再デプロイ時のデータ損失ゼロを狙う自動DBマイグレーション用エントリポイントを組み込んでいます。
  • 実験では検証精度96.2%、AUC-ROC 0.98、さらに貧血クラスに対する感度0.96を達成し、3エポックCPUのみのベースライン(検証精度44.9%、AUC-ROC 0.58)を大きく上回る結果を示しています。地域のヘルスワーカー向けの第一線スクリーニングツールとしての適性が示され、ソースコードも公開されています。

Abstract

貧血は世界で10億人以上に影響しており、検査室での血液検査が利用できない低資源地域では、深刻なほど診断が十分に行われていません。本論文では、まぶたの結膜と爪床のスマートフォン撮影画像から、非侵襲的に貧血をスクリーニングするエンドツーエンドのWebベースシステム「AnemiaVision」を提示します。提案手法のパイプラインは、事前学習済みのEfficientNet-B3バックボーンを微調整し、BatchNorm、GELU活性化関数、ならびに高率Dropout(0.45/0.35)を組み込んだ再設計の3層分類ヘッドを採用します。学習では、4つの直交する精度向上手法を用います:方策不要の画像拡張であるTrivialAugmentWide、空間的正則化のためのRandomErasing、クラス間のなめらかさを促すMixup(alpha=0.2)、および線形ウォームアップを伴うcosine-annealingスケジューリングです。早期終了は、検証損失ではなくピークの検証精度に基づいて制御し、分散の高いエポックでの早過ぎる打ち切りを防ぎます。デプロイされたFlaskアプリケーションは、Render上のPostgreSQLに裏付けられた永続的な患者履歴管理を統合し、再デプロイ間でデータ損失がゼロになることを保証する自動化されたデータベース移行のエントリポイントを備えています。アブレーション実験により、精度優先の早期終了が最終的な検証精度に+1.6%、Mixupが+2.8%寄与することが示されました。全体として、提案システムは検証精度96.2%およびAUC-ROC 0.98を達成しました。これは、3エポックのCPUのみのベースラインにおける検証精度44.9%およびAUC-ROC 0.58と比較して大幅に優れています。貧血クラスに対する感度は0.96に達し、本システムは農村部における地域の保健従事者のための一次スクリーニングツールとして適しています。システムは一般に公開されており、ソースコードもオープンに提供されています。

AnemiaVision:スマートフォン画像によるEfficientNet-B3とTrivialAugmentWide、Mixup拡張、永続的な患者履歴管理で実現する非侵襲的貧血検出 | AI Navigate