PAI: AIによる高速・正確・全ベンチマーク性能予測

arXiv cs.AI / 2026/3/23

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

PAI は、従来のサイクル精度シミュレーションや命令単位のエンコーディングに依存することなく、全ベンチマーク性能を正確に予測する階層型LSTMベースのモデルである。
プログラム実行から得られる、マイクロアーキテクチャに依存しない特徴のトレースを用いて、性能指標を予測する。
SPEC CPU 2017 において、PAI は平均 IPC 予測誤差 9.35% を達成し、全スイートを約 2 分 57 秒で処理。従来の手法より約 1000 倍高速である。
この手法は、従来の ML ベースの制約（速度と精度）を克服し、プレシリコン段階の電力・性能分析をより高速に行い、競争力のあるベンチマークを可能にする。

要旨：現代のSoCにおける複雑なIPの指数関数的増加は、ムーアの法則に動機づけられ、ハードウェアとソフトウェアの電力・性能分析を迅速かつ正確に行う必要性を生み出しています。従来の性能シミュレータ（サイクル精度シミュレータなど）は、合理的な時間内に全ベンチマークをシミュレートするにはしばしば遅すぎ、開発・保守・拡張には相当な労力を要し、エラーが発生しやすく、プレシリコンの性能予測と競合分析をますます困難にしています。機械学習を用いてこの課題に取り組んだこれまでの試みは、遅い、精度が低い、あるいは全ベンチマークの性能を予測できない、という点で不足しています。これらの限界に対処するため、PAIを提案します。PAIは、詳細なシミュレーションや命令単位のエンコーディングに依存せず、全ベンチマークの性能を正確に予測する初の手法です。PAIの中心には、プログラム実行からマイクロアーキテクチャ非依存特徴のトレースを取り、それを用いて性能指標を予測する、階層的Long Short Term Memory（LSTM）ベースのモデルがあります。PAIの詳細設計・実装・評価を提示します。初期の実験では、PAIがSPEC CPU 2017ベンチマークスイート全体に対して平均IPC予測誤差9.35%を達成し、全スイートの実行にはわずか2分57秒しかかからないことを示しました。この予測誤差は従来の最先端技術と同等の水準でありながら、所要時間は約3桁分の短縮を実現します。

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

Reddit r/artificial

状態の外部化

Dev.to

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

Dev.to

私のAIには時計がない

Dev.to

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？

Reddit r/LocalLLaMA

PAI: AIによる高速・正確・全ベンチマーク性能予測

要点

関連記事

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

状態の外部化

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

私のAIには時計がない

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

状態の外部化

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

私のAIには時計がない

コーディング向けの LLM をどう選ぶべきか？ 注目すべきパラメータは何か？

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？