ニューラルネットワークの反転:指定された出力からニューラルネットワーク入力を生成するための新しい手法

arXiv cs.CV / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、ニューラルネットワークが所望のクラス出力に対応づける入力画像を求めるという逆問題に取り組み、そのクラスに対応する認識可能な特徴が何であるかを明らかにすることを目的とする。
  • 入力を反転するための2つの一般的な戦略を提案する。1つは、入力ヤコビアンを用いたルート探索によって順伝播(forward-pass)で反転を行う方法。もう1つは、層を逐次的に逆変換しつつランダムな零空間ベクトルを注入することで逆伝播(backward-pass)で反転を行う方法である。
  • 著者らは、提案手法をトランスフォーマー系のアーキテクチャと、より単純な逐次の線形層ネットワークの両方で検証する。
  • 結果として、これらの手法は、分類スコアがほぼ完璧でありながら、ランダムのような入力画像を生成できることを示し、ネットワークが入力空間をどのように学習し表現しているかに潜む脆弱性を浮き彫りにする。
  • 本研究は、これらの手法が逆写像を満たすための入力候補に対してより広い「カバレッジ」を提供し得ることを主張しており、ネットワーク挙動の理解やセキュリティ上の弱点の特定に役立つ可能性を示す。