MobileAgeNet：モバイル展開向け軽量な顔年齢推定

arXiv cs.CV / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research

共有:

要点

本論文では、モバイル展開を目的に低遅延かつコンパクトな構成を重視した顔年齢推定モデル「MobileAgeNet」を提案する。
MobileAgeNetはUTKFaceのheld-outテストセットでMAE 4.65年を報告し、AI Benchmarkアプリで計測した平均オンデバイス遅延は約14.4 msである。
モデルは事前学習済みのMobileNetV3-Largeバックボーンとコンパクトな回帰ヘッドを組み合わせ、わずか3.23Mパラメータで競争力のある精度を達成している。
学習と評価はNN LEMUR Datasetフレームワーク上で実装されており、再現可能な実験、構造化されたハイパーパラメータ最適化、一貫した評価を可能にする。
PyTorchでの学習からONNXへのエクスポート、さらにTensorFlow Liteへの変換までのデプロイ手順を提示し、実運用条件で予測挙動の劣化が測定できないとしている。
有界な年齢回帰と2段階のファインチューニングにより、学習の安定性と汎化性能を高める工夫がされている。

要旨: 顔の年齢推定のモバイル展開には、予測精度と低遅延および小型性のバランスを取るモデルが必要である。本研究では、軽量な年齢回帰フレームワークであるMobileAgeNetを提示する。MobileAgeNetは、UTKFaceの保持用テストセットにおいてMAEが4.65年を達成し、さらにAI Benchmarkアプリケーションを用いて測定した平均レイテンシ14.4 msで効率的なオンデバイス推論を維持する。モデルは、事前学習済みのMobileNetV3-Largeバックボーンとコンパクトな回帰ヘッドを組み合わせて構築されており、モバイル端末上でリアルタイム予測を可能にする。学習および評価のパイプラインはNN LEMUR Datasetフレームワークに統合されており、再現可能な実験、構造化されたハイパーパラメータ最適化、ならびに一貫した評価を支援する。学習の安定性と汎化性能を高めるために、上限制約付きの年齢回帰と二段階のファインチューニング戦略を併用する。実験結果は、MobileAgeNetが3.23Mパラメータで競争力のある精度を達成すること、またPyTorchでの学習からONNXへのエクスポート、さらにTensorFlow Liteへの変換に至る展開パイプラインが、実用的なオンデバイス条件下で測定可能な劣化を伴わずに予測挙動を保持することを示している。総じて、本研究はモバイル向けの顔年齢推定のための、実用的で展開準備が整ったベースラインを提供する。