新機能 - llama.cpp向けのApple Neural Engine（ANE）バックエンド

Reddit r/LocalLLaMA / 2026/3/31

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

共有:

要点

GitHubで、llama.cpp向けにApple Neural Engine（ANE）を使う「ggml ANE backend」が新たに動作する形で報告されています。
ANEに対してPRIVATE API経由でMUL_MATをディスパッチする実装になっており、Apple Silicon（特にM4 Pro）での推論高速化を狙っています。
M4 ProではN=256時にピーク4.0 TFLOPSを示し、CPUに対して最大16.8倍速いとされるほか、MIL側のtransposeやカーネルキャッシュ、量子化重みのサポートも挙げられています。
prefillはANE（N>=64）を用い、decodeはMetal/CPUを使い分ける構成であるため、ワークロード特性に応じた分担が行われています。
実装コードはarozanov/ggml-aneとして公開され、maderix/ANE bridgeをベースにしているとされています。

これは数日前にGitHub上で見つかりました。ANEはApple Siliconのすべてに搭載されているNPUであり、新しい「Neural Accelerator」GPUコア（M5のみに搭載）ではない点に注意してください。

(ggml-org/llama.cpp#10453) - arozanov のコメント

動作するggml ANEバックエンドを構築しました。MUL_MATを専用API経由でANEへディスパッチします。

M4 Proの結果:
N=256で4.0 TFLOPSピーク、CPUより16.8倍高速
MIL側の転置、カーネルキャッシュ、量子化された重みのサポート
prefill向けのANE（N>=64）、decodeはMetal/CPU

コード: https://github.com/arozanov/ggml-ane
maderix/ANE bridgeをベースにしています。

投稿者 /u/PracticlySpeaking
[リンク] [コメント]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 3/31Dailyインサイトを見る →

Black Hat Asia

AI Business

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

日経XTECH

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化

日経XTECH

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

日経XTECH

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

日経XTECH

新機能 - llama.cpp向けのApple Neural Engine（ANE）バックエンド

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

💡 この記事が使われたインサイト

関連記事

Black Hat Asia

米国のデータセンター投資、オフィス超えへ AI急成長で建築の主役交代

AIリテラシーをどう教えるか、自分事として考える 知識創造理論の内面化

ナトリウムイオン電池、中国圧倒も「日本に勝機ある」／ニコンやキヤノン抜き去ったASML、AI半導体時代の水平分業先取り

AIはツールから「同僚」へ、メルカリは複数エージェントが意思疎通

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

AIリテラシーをどう教えるか、自分事として考える知識創造理論の内面化