MEMO: マスク付きエッジ予測による人間のようなシャープなエッジ検出

arXiv cs.CV / 2026/3/24

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、MEMO(Masked Edge Prediction Model)を提案し、特殊な損失関数やアーキテクチャの変更なしに、交差エントロピー損失のみで、人間のような「シャープで」「単一ピクセルの」エッジ出力が実現できることを示します。
  • MEMOは大規模な合成エッジデータセットで事前学習して汎化性能を高め、その後、約1.2%の追加パラメータのみで済む軽量モジュールを加えて下流タスクで微調整します。
  • 学習中、モデルは入力のマスク率を変えた条件下でエッジを予測することを学習し、ロバスト性を高めるとともに、推論時にシャープさを可能にします。
  • 主要な推論の発想は、太いエッジが信頼度(confidence)の勾配と相関する点にあり、MEMOは、信頼度の順序に基づく段階的な予測戦略によりピクセルを逐次的に確定させ、より薄く正確な輪郭を生成します。
  • 実験では、従来手法と比較して、シャープさを意識した性能が向上し、ポストプロセッシングなしでエッジマップを生成できることが報告されています。