AI Navigate

PAI: AIによる高速・正確・全ベンチマーク性能予測

arXiv cs.AI / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • PAI は、従来のサイクル精度シミュレーションや命令単位のエンコーディングに依存することなく、全ベンチマーク性能を正確に予測する階層型LSTMベースのモデルである。
  • プログラム実行から得られる、マイクロアーキテクチャに依存しない特徴のトレースを用いて、性能指標を予測する。
  • SPEC CPU 2017 において、PAI は平均 IPC 予測誤差 9.35% を達成し、全スイートを約 2 分 57 秒で処理。従来の手法より約 1000 倍高速である。
  • この手法は、従来の ML ベースの制約(速度と精度)を克服し、プレシリコン段階の電力・性能分析をより高速に行い、競争力のあるベンチマークを可能にする。

要旨:現代のSoCにおける複雑なIPの指数関数的増加は、ムーアの法則に動機づけられ、ハードウェアとソフトウェアの電力・性能分析を迅速かつ正確に行う必要性を生み出しています。従来の性能シミュレータ(サイクル精度シミュレータなど)は、合理的な時間内に全ベンチマークをシミュレートするにはしばしば遅すぎ、開発・保守・拡張には相当な労力を要し、エラーが発生しやすく、プレシリコンの性能予測と競合分析をますます困難にしています。機械学習を用いてこの課題に取り組んだこれまでの試みは、遅い、精度が低い、あるいは全ベンチマークの性能を予測できない、という点で不足しています。これらの限界に対処するため、PAIを提案します。PAIは、詳細なシミュレーションや命令単位のエンコーディングに依存せず、全ベンチマークの性能を正確に予測する初の手法です。PAIの中心には、プログラム実行からマイクロアーキテクチャ非依存特徴のトレースを取り、それを用いて性能指標を予測する、階層的Long Short Term Memory(LSTM)ベースのモデルがあります。PAIの詳細設計・実装・評価を提示します。初期の実験では、PAIがSPEC CPU 2017ベンチマークスイート全体に対して平均IPC予測誤差9.35%を達成し、全スイートの実行にはわずか2分57秒しかかからないことを示しました。この予測誤差は従来の最先端技術と同等の水準でありながら、所要時間は約3桁分の短縮を実現します。