フォトニックAI:受動光学リアルタイム画像分類のためのハイブリッド回折ホログラフィック・ニューラルシステム

arXiv cs.LG / 2026/4/20

📰 ニュースDeveloper Stack & InfrastructureModels & Research

要点

  • 本論文は、光学エッジ計算が、時計駆動の演算ではなく波の伝搬・回折・干渉によって線形変換を行うことで、データ移送に伴うエネルギーとレイテンシを削減できると主張している。
  • 回折光学ニューラルネットワーク(DONN)と、デジタルで最適化した位相分布を製造可能で干渉パターンとして実装できる形へ写像するホログラフィック干渉ベース学習(HIBL)オペレータを組み合わせたハイブリッド回折ホログラフィック構成を提案している。
  • 推論パイプラインを、エンコード、位相変調、自由空間伝搬、強度計測という演算子の合成として定式化し、学習される量と設計で固定される量、ならびに非線形性がフォトディテクションでどこに入るかを明確にしている。
  • MNISTでの物理に基づくシミュレーションでは、層数3、位相素子約25,000のシステムでテスト精度91.2%かつ伝搬律速のナノ秒スケール遅延が報告されている。
  • 主な貢献は性能主張よりも、学習した光学変換を受動的な物理部材として実現するための、厳密なオペレータ論的計算フレームワークにあるとしている。

Abstract

エッジ・インテリジェンスは、電子メモリ階層を通じてデータを受け渡すことに伴うエネルギーおよびレイテンシ(遅延)のコストによって制約されます。光学システムは、本質的に異なる計算レジームを提供します。入力の波面が、構造化された媒質へと投入されると、伝搬、回折、干渉が一体となって線形変換を実行します。この変換のコストは、クロック駆動の演算ではなく、波動物理により決まります。本論文では、そのレジームに対する厳密なシステム・レベルの取り扱いを構築し、画像分類のためのハイブリッド回折型ホログラフィック・アーキテクチャを提案します。提案モデルは、回折光学ニューラルネットワーク(DONN)と、ホログラフィック干渉ベース学習(HIBL)演算子を結合します。これは、デジタルで最適化された位相分布から、物理的に実現可能で、製造(ファブリケーション)に適合した干渉パターンへ写像する、形式的なマップです。そして、その干渉パターンは、受動的な光学素子に組み込めます。推論の全プロセスを、符号化、位相変調、自由空間伝搬、そして強度測定の演算子として表現することで、何が学習されるのか、何が設計によって固定されるのか、そして非線形性がフォトディテクションを通じてどこに入るのかを明確にします。この演算子論的な見方により、学習した変換を行うことと、それを物理的に実現することの間に横たわる、光学ML文献における持続的なギャップが解消されます。MNISTにおける物理に基づいたシミュレーションでは、約25,000個の位相要素をもつ3層システムが、伝搬によって制限されたナノ秒級のレイテンシで、91.2%のテスト精度を達成します。主要な貢献は、性能の主張ではありません。むしろ、精密な計算フレームワークです。学習された表現は、構造化された光学媒体へ物理的に埋め込むことができ、推論は、順次的な電子的な「乗算・加算」操作ではなく、受動的に製造された物体による波面変換として実行されます。