[D] 安全性が重要な植物／菌類の同定にYOLOを見限った理由：クローズドセット分類は「静かな失敗モード」

Reddit r/MachineLearning / 2026/4/1

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

著者は食用／有毒な植物や菌類を同定するためにYOLOで高い精度を達成したものの、未知（アウト・オブ・ディストリビューション：OOD）画像が既知クラスへ高い確信度で強制的に割り当てられてしまう、重大なクローズドセットの失敗モードを見つけたことを報告する。
単純な信頼度（confidence）閾値の調整では不十分な理由を説明する。softmax出力はクローズドセット上で正規化されるため、OODの信頼度スコアが、分布内（in-distribution）の予測と見分けがつかない形になってしまう。
この安全性に関わる「静かな失敗」を解消するために、YOLOの代わりとして、専門家であるEfficientNetモデル群による階層型OOD検出パイプラインを採用し、MobileNetV3のドメインルータ、さらにsoftmax前の生ログitに対するエネルギーベースのスコアリングを用いる。
専門家モデル間のアンサンブル不一致（disagreement）を活用し、さらに各モデルをk+1番目の「該当なし（none of the above）」クラスで再学習することで、OOD拒否（rejection）を一段と向上させる。
解決策は、バッテリー駆動の携帯型ハンドヘルドでオンデバイス実行できるよう、Hailo 8L 13 TOPSの計算予算に制約されている。現実世界の遅延（レイテンシ）と頑健性の両方を優先する。

私は、食用および有毒な野生植物、そしてきのこを現地で同定するための、完全に端末上で動作するオープンソースのハンドヘルド機器を作ってきました。最初の段階では、iNaturalistの研究グレードデータを使って専門のYOLOモデルを学習させ、目標とする種に対して94〜96%の精度を達成しました。とても良い感じだったのですが、このサブで十分に議論されていない問題を見つけるまでは。

YOLOのクローズドセット構造には「わからない」という概念がありません。分布外（OOD）の画像を与えると、それを自信をもって、そのクラスの1つだと（ほぼ100%の確信度で）分類してしまいます。多くのCVのケースではこれは単なる面倒で済むことがありますが、採集（foraging）では致命的になり得ます。

最初は確信度（confidence）のしきい値を微調整してみましたが、うまくいきません。ソフトマックス出力がクローズドセットで正規化されるため、分布外入力の確信度スコアは、分布内の予測と区別できないのです。「上記のいずれでもない」に割り当てられた確率質量が存在しません。

そこで私はYOLOから完全に離れました（用途は動画ストリームではなく、単発の画像分類です）そして、階層化したOOD検出パイプラインを構築しました。

- EfficientNet B2の専門モデル：1つの巨大な検出器ではなく、菌類（Mycologist）、ベリー、そして高価値の採集対象に特化。

- MobileNetV3の小型ドメインルータ：入力を適切な専門モデルへ振り分ける、または分類の前に拒否する。

- ソフトマックス前の生ログitに対するエネルギー・スコアリング：OOD入力を検出するために、ソフトマックスの前段のログitに基づいてエネルギースコアを計算します。エネルギースコアは、ソフトマックスの確信度よりもはるかにきれいに分布内とOODを分離します。

- 3つの専門家（スペシャリスト）間でのアンサンブル不一致を、二次的なOODシグナルとして使う。

- 各専門モデルにK+1の「上記のいずれでもない」クラスを再学習する。

この全パイプラインは、バッテリー駆動のハンドヘルドで、Hailo 8Lの13 TOPSという計算予算の範囲内で動作させる必要があります。アーキテクチャ上の選択は、デスクトップでの精度だけでなく、実際の推論レイテンシによって制約されます。

安全に直結するアプリケーションで、同様のクローズドセットの確信度問題に遭遇した方がいるか、またどのようなアプローチを取られたか気になっています。

エネルギー・スコアリング手法（Liu et al.による「Energy-based Out-of-Distribution Detection」論文のもの）は、ネイティブな確信度しきい値処理に対して、最も大きな改善でした。

submitted by /u/Adebrantes
[link] [comments]

Black Hat USA

AI Business

Black Hat Asia

AI Business

柴田社長肝いり「Renesas 365」姿現す、将来はAIエージェントと連携

日経XTECH

ラピダスCTO、1ナノでTSMCと「半年差に」まずは信頼獲得から

日経XTECH

トヨタ車体富士松工場、構内運搬車を10年越しでレベル4自動運転化

日経XTECH

[D] 安全性が重要な植物／菌類の同定にYOLOを見限った理由：クローズドセット分類は「静かな失敗モード」

要点

関連記事

Black Hat USA

Black Hat Asia

柴田社長肝いり「Renesas 365」姿現す、将来はAIエージェントと連携

ラピダスCTO、1ナノでTSMCと「半年差に」まずは信頼獲得から

トヨタ車体富士松工場、構内運搬車を10年越しでレベル4自動運転化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

Black Hat Asia

柴田社長肝いり「Renesas 365」姿現す、将来はAIエージェントと連携

ラピダスCTO、1ナノでTSMCと「半年差に」 まずは信頼獲得から

トヨタ車体富士松工場、構内運搬車を10年越しでレベル4自動運転化

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

ラピダスCTO、1ナノでTSMCと「半年差に」まずは信頼獲得から