3D S-NUCA Many-Cores における、サーマルおよびカーネル認識型 LFM 推論のための能動的模倣学習
arXiv cs.LG / 2026/4/15
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、より良い帯域/局所性を備える一方でサーマルおよびキャッシュ遅延の課題を抱える、次世代の3Dスタック Static Non-Uniform Cache Architecture(3D S-NUCA)CPU上で、大規模基盤モデル(LFM)の推論を効率的に実行するという課題に取り組む。
- それに対し、本論文では AILFM(Active Imitation Learning)という、オラクルによるデモンストレーションを用いて、サーマルを考慮したほぼ最適なスレッド移行および V/f スケーリング方策を学習するスケジューリング・フレームワークを提案する。
- AILFM は、コア単位の性能ヘテロジニアス(不均一性)と、多様な LFM カーネルにわたるカーネル固有の振る舞いの両方を明示的にモデル化し、動作をサーマル安全制約の範囲内に保つ。
- 著者らは、広範な実験結果により、AILFM が既存の最先端ベースラインを上回り、さまざまな LFM 推論ワークロードに対して汎化することを報告している。




