広告

[D] 安全性が重要な植物/菌類の同定にYOLOを見限った理由:クローズドセット分類は「静かな失敗モード」

Reddit r/MachineLearning / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 著者は食用/有毒な植物や菌類を同定するためにYOLOで高い精度を達成したものの、未知(アウト・オブ・ディストリビューション:OOD)画像が既知クラスへ高い確信度で強制的に割り当てられてしまう、重大なクローズドセットの失敗モードを見つけたことを報告する。
  • 単純な信頼度(confidence)閾値の調整では不十分な理由を説明する。softmax出力はクローズドセット上で正規化されるため、OODの信頼度スコアが、分布内(in-distribution)の予測と見分けがつかない形になってしまう。
  • この安全性に関わる「静かな失敗」を解消するために、YOLOの代わりとして、専門家であるEfficientNetモデル群による階層型OOD検出パイプラインを採用し、MobileNetV3のドメインルータ、さらにsoftmax前の生ログitに対するエネルギーベースのスコアリングを用いる。
  • 専門家モデル間のアンサンブル不一致(disagreement)を活用し、さらに各モデルをk+1番目の「該当なし(none of the above)」クラスで再学習することで、OOD拒否(rejection)を一段と向上させる。
  • 解決策は、バッテリー駆動の携帯型ハンドヘルドでオンデバイス実行できるよう、Hailo 8L 13 TOPSの計算予算に制約されている。現実世界の遅延(レイテンシ)と頑健性の両方を優先する。

私は、食用および有毒な野生植物、そしてきのこを現地で同定するための、完全に端末上で動作するオープンソースのハンドヘルド機器を作ってきました。最初の段階では、iNaturalistの研究グレードデータを使って専門のYOLOモデルを学習させ、目標とする種に対して94〜96%の精度を達成しました。とても良い感じだったのですが、このサブで十分に議論されていない問題を見つけるまでは。

YOLOのクローズドセット構造には「わからない」という概念がありません。分布外(OOD)の画像を与えると、それを自信をもって、そのクラスの1つだと(ほぼ100%の確信度で)分類してしまいます。多くのCVのケースではこれは単なる面倒で済むことがありますが、採集(foraging)では致命的になり得ます。

最初は確信度(confidence)のしきい値を微調整してみましたが、うまくいきません。ソフトマックス出力がクローズドセットで正規化されるため、分布外入力の確信度スコアは、分布内の予測と区別できないのです。「上記のいずれでもない」に割り当てられた確率質量が存在しません。

そこで私はYOLOから完全に離れました(用途は動画ストリームではなく、単発の画像分類です)そして、階層化したOOD検出パイプラインを構築しました。

- EfficientNet B2の専門モデル:1つの巨大な検出器ではなく、菌類(Mycologist)、ベリー、そして高価値の採集対象に特化。

- MobileNetV3の小型ドメインルータ:入力を適切な専門モデルへ振り分ける、または分類の前に拒否する。

- ソフトマックス前の生ログitに対するエネルギー・スコアリング:OOD入力を検出するために、ソフトマックスの前段のログitに基づいてエネルギースコアを計算します。エネルギースコアは、ソフトマックスの確信度よりもはるかにきれいに分布内とOODを分離します。

- 3つの専門家(スペシャリスト)間でのアンサンブル不一致を、二次的なOODシグナルとして使う。

- 各専門モデルにK+1の「上記のいずれでもない」クラスを再学習する。

この全パイプラインは、バッテリー駆動のハンドヘルドで、Hailo 8Lの13 TOPSという計算予算の範囲内で動作させる必要があります。アーキテクチャ上の選択は、デスクトップでの精度だけでなく、実際の推論レイテンシによって制約されます。

安全に直結するアプリケーションで、同様のクローズドセットの確信度問題に遭遇した方がいるか、またどのようなアプローチを取られたか気になっています。

エネルギー・スコアリング手法(Liu et al.による「Energy-based Out-of-Distribution Detection」論文のもの)は、ネイティブな確信度しきい値処理に対して、最も大きな改善でした。

submitted by /u/Adebrantes
[link] [comments]

広告