計算機科学 > ハードウェアアーキテクチャ
arXiv:2603.08721 (cs)
[2026年2月10日に投稿]
題名:KernelCraft: 新興ハードウェア上でのエージェントによるクローズトゥメタルなカーネル生成のためのベンチマーク
著者:Jiayi Nie, Haoran Wu, Yao Lai, Zeyu Cao, Cheng Zhang, Binglei Lou, Erwei Wang, Jianyi Cheng, Timothy M. Jones, Robert Mullins, Rika Antonova, Yiren Zhao
Jiayi Nie および他11名の著者による「KernelCraft: 新興ハードウェア上でのエージェントによるクローズトゥメタルなカーネル生成のためのベンチマーク」という題名の論文のPDFを表示
PDFを見る
HTML(実験的)
要旨:新しい命令セットアーキテクチャ(ISA)を備えた新規AIアクセラレータでは、開発者が低レベルのカーネルを手作業で作り込む必要があることが多く、その工程は時間がかかり、労力を要し、さらにエラーが起きやすい。そのため、多様なハードウェアターゲットに対してスケールさせることができず、新興のハードウェアプラットフォームが効率的に市場投入することを妨げている。LLMベースのコード生成が成熟したGPUエコシステムでは有望であることは示されてきたが、新しいISAを持つ新興ハードウェアに対して、エージェント型LLMシステムが迅速に妥当で効率的なカーネルを生成できるかどうかは依然として不明である。我々は、関数呼び出しとフィードバック主導のワークフローを通じて、カスタムアクセラレータ向けの低レベルカーネルを生成・最適化するLLMエージェントの能力を評価するための最初のベンチマークとして KernelCraft を提示する。KernelCraft では、エージェントがコンパイルチェック、シミュレーション、そしてグラウンドトゥルースに対する正しさ検証から得られる自動フィードバックを用いて、ISAおよびハードウェアの制約下でカーネルを洗練(リファイン)する。我々の実験では、3つの新興アクセラレータ基盤にまたがり、20以上のMLタスクに対してエージェント性能を評価する。それぞれのタスクに対して多様なタスク構成を5種類用意し、特にタスク構成の複雑さを対象とした詳細な評価を行う。4つの主要な推論モデルにおいて、上位のエージェントは、これまで見たことのないISAに対して、数ステップのリファインで機能的に妥当なカーネルを生成する。さらに、テンプレートベースのコンパイラによるベースラインと同等以上の性能を達成する最適化カーネルを得ることを示す。これにより、アクセラレータ設計者およびカーネル開発者のためのカーネル開発コストを削減できる可能性を示す。
| 分野: | ハードウェアアーキテクチャ (cs.AR); 機械学習 (cs.LG); ソフトウェア工学 (cs.SE) |
| 引用: | arXiv:2603.08721 [cs.AR] |
| (この版の場合は arXiv:2603.08721v1 [cs.AR]) | |
| https://doi.org/10.48550/arXiv.2603.08721
詳細を学ぶにはここにフォーカス
DataCite 経由で発行された arXiv DOI
|
参考文献 & 引用
- NASA ADS
- Google Scholar
- Semantic Scholar
BibTeX の引用をエクスポート
読み込み中...
書誌ツール
コード、データ、メディア
デモ
関連論文
About arXivLabs
書誌および引用ツール
書誌エクスプローラー切り替え
書誌エクスプローラー (エクスプローラーとは?)
Connected Papers 切り替え
Connected Papers (Connected Papers とは?)
Litmaps 切り替え
Litmaps (Litmaps とは?)
scite.ai 切り替え
scite スマート引用 (スマート引用とは?)
この論文に関連するコード、データ、メディア
alphaXiv 切り替え
alphaXiv (alphaXivとは?)
コード切り替えへのリンク
論文向けCatalyzeXコードファインダー (CatalyzeXとは?)
DagsHub切り替え
DagsHub (DagsHubとは?)
GotitPub切り替え
Gotit.pub (GotitPubとは?)
Huggingface切り替え
Hugging Face (Huggingfaceとは?)
コード切り替えへのリンク
Papers with Code (Papers with Codeとは?)
ScienceCast切り替え
ScienceCast (ScienceCastとは?)
デモ
Replicate切り替え
Replicate (Replicateとは?)
Spaces切り替え
Hugging Face Spaces (Spacesとは?)
Spaces切り替え
TXYZ.AI (TXYZ.AIとは?)
レコメンダーおよび検索ツール
Influence Flowerへのリンク
Influence Flower (Influence Flower とは?)
Core recommender トグル
CORE Recommender (CORE とは?)
arXivLabs: コミュニティの協力者とともに行う実験的プロジェクト
arXivLabs は、協力者が当社のウェブサイト上で直接新しい arXiv の機能を開発し、共有できるようにするための枠組みです。
arXivLabs に関わっている個人および組織は、オープン性、コミュニティ、卓越性、ユーザーデータのプライバシーという当社の価値観を受け入れ、それを理解しました。arXiv はこれらの価値観に取り組んでおり、それらを遵守するパートナーとのみ連携します。
arXiv のコミュニティに価値をもたらすプロジェクトのアイデアはありますか? arXivLabs について詳しく知る。


