DHFP-PE:AI加速のためのデュアル精度ハイブリッド浮動小数点処理エレメント
arXiv cs.RO / 2026/4/7
💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、エネルギー効率の高いAIおよびエッジワークロード向けに最適化された、完全にパイプライン化されたデュアル精度浮動小数点MAC処理エレメントを提案する。FP8(E4M3、E5M2)とFP4(E2M1、E1M2)の両方のフォーマットに対応する。
- 単一の4ビット乗算器を、FP8演算では従来の4×4乗算として、また小さなオペランドの場合では2つの並列な2×2乗算として振る舞わせることを可能にするビット分割手法を導入し、ロジックの重複なしにハードウェアの利用率を最大化する。
- 設計は28nmプロセスで実装され、動作周波数1.94GHz、面積0.00396mm²、消費電力2.13mWが報告されている。
- 従来の最先端アプローチと比較して、本アーキテクチャは最大で面積を60.4%削減し、電力を86.6%節約できると主張しており、低精度・MAC中心のアクセラレータに対する高い効率性の可能性を示している。
- 本研究は、低精度演算に依存するAIシステムにおいてスループット/ワットを向上させ得る、アクセラレータ向けのハードウェア構成要素として位置付けられる。

