要旨: 揚げ油の劣化を監視することは食品の安全性にとって重要ですが、現行の手法は破壊的な湿式化学分析に依存しており、空間情報を得られず、またリアルタイム用途にも適していません。私たちは、熱画像に基づく検査における根本的な障害として、カメラ指紋(camera-fingerprint)のショートカットを特定します。これは、モデルが酸化の化学を学習するのではなく、センサー固有のノイズや熱バイアスを記憶してしまい、動画を切り離した評価(video-disjoint evaluation)で破綻する現象です。そこで、FryNet を提案します。FryNet は、デュアルストリームの RGB-熱赤外フレームワークであり、1 回のフォワードパスで、油領域のセグメンテーション、使用可能性(serviceability)の分類、ならびに 4 つの化学的酸化指標(PV, p-AV, Totox, 温度)の回帰を同時に行います。チャンネル注意と空間注意を備えた ThermalMiT-B2 バックボーンが熱特徴を抽出し、一方で RGB-MAE Encoder は、マスク付き自己符号化と化学的整合(chemical alignment)を通じて、化学的に根拠のある表現を学習します。Dual-Encoder の DANN は、Gradient Reversal Layer により両ストリームを動画の同一性(video identity)に対して逆向きに正則化(adversarially regularize)し、FiLM fusion により熱の構造と RGB の化学的コンテキストを橋渡しします。28 本の揚げ動画にわたる 7,226 組のペア画像フレームで、FryNet は 98.97% mIoU、100% の分類精度、2.32 の平均回帰 MAE を達成し、7 つすべてのベースラインを上回ります。
FryNet:デュアルストリーム・敵対的フュージョンによる非破壊フライ油酸化度評価
arXiv cs.CV / 2026/4/24
📰 ニュースDeveloper Stack & InfrastructureModels & Research
要点
- 本論文は、既存のフライ油酸化モニタリングの限界として、湿式の化学分析が破壊的で空間情報を欠き、リアルタイム運用にも適さない点を指摘している。
- 熱画像ベース検査における「カメラ・フィンガープリント・ショートカット」という根本障害を特定し、モデルが酸化化学を学ぶのではなくセンサー由来のノイズや熱バイアスを記憶してしまうため、ビデオが異なる評価で破綻すると説明している。
- 提案手法FryNetはRGB–熱のデュアルストリーム構成により、油領域のセグメンテーション、サービス可能性の分類、そして酸化指標4種(PV、p-AV、Totox、温度)の回帰を1回のフォワードパスで同時に行う。
- FryNetは、ThermalMiT-B2に注意機構を組み合わせ、RGB側には化学的整合を伴うマスクオートエンコーディングで学習するRGB-MAEエンコーダを採用し、さらにGradient Reversal LayerによるデュアルエンコーダDANNの敵対的正則化と、熱の構造とRGBの化学文脈をつなぐFiLMフュージョンを組み合わせている。
- 28本のフライ動画から7,226組のペアフレームで評価した結果、セグメンテーションで98.97% mIoU、分類で100%精度、回帰で平均MAE 2.32を報告し、7つのベースラインを上回ったとしている。


