FruitProM-V2:果物・野菜の頑健な確率的熟度推定と検出

arXiv cs.AI / 2026/4/30

💬 オピニオンModels & Research

要点

  • 本論文は、果物や野菜の熟度は連続的な生物学的プロセスである一方、視覚ベースの推定ではしばしばハードな多クラス境界に落とし込まれており、見た目が非常に近い段階を正確に表せないと指摘しています。
  • 2名の独立したアノテータによるアノテーション信頼性調査を、保持データセットのトマトに対して実施した結果、解釈の不一致は隣接する熟度段階の近傍に集中していることが分かりました。
  • この問題に対しFruitProM-V2では、熟度を潜在的な連続変数として扱い、確率的な「分布型検出ヘッド」を用いて分布を学習し、その分布をCDF(累積分布関数)でクラス確率へ変換する手法を提案しています。
  • 確率的な定式化は、クリーンなラベル環境では標準的な検出器と同等の性能を維持しつつ、不確実性をより適切に表現できるとしています。
  • さらに学習時に制御したラベルノイズを導入すると、確率モデルはベースラインよりも頑健性が高く、不確実性を明示的にモデル化することで熟度推定の信頼性が高まることが示されています。

Abstract

正確な果実の成熟度の識別は収穫時期を決定するために不可欠であり、不適切な評価は収量および収穫後品質に直接影響します。成熟(熟度)の進行は連続的な生物学的プロセスであるにもかかわらず、視覚に基づく成熟度推定は通常、多クラス分類問題として定式化されます。そのため、見た目がよく似た段階の間に不連続な境界が生じます。この制約を検証するために、保持しておいたトマトのデータセットに対して独立した2名のアノテータによるアノテーション信頼性に関する研究を行い、成熟段階が隣接する付近に不一致が集中していることを観察します。この観察に動機づけられ、成熟度を潜在の連続変数としてモデル化し、分布検出ヘッドを用いて確率的に予測します。そして分布を累積分布関数(CDF)を通じてクラス確率へと変換します。提案する定式化は、クリーンなラベル下では標準の検出器と同等の性能を維持しつつ、不確実性をより適切に表現します。さらに、学習中に制御されたラベルノイズを導入した場合、確率的モデルはベースラインに比べて頑健性が向上することが示されます。これは、成熟度の不確実性を明示的にモデリングすることで、より信頼性の高い視覚的成熟度推定が可能になることを示しています。