Metaが推論に焦点を当てた4つの新しいMTIAチップを発表

Reddit r/LocalLLaMA / 2026/3/13

📰 ニュースIndustry & Market Moves

原文を読む →

共有:

要点

推論に焦点を当てたMTIA世代チップ（300〜500、約2年間で開発）で、完全なリデザインを行わずに部品を交換できるモジュール式チップレットを採用。
MTIA 450および500は推論優先設計で、NVIDIAのトレーニング優先アプローチとは対照的。Metaの規模要件に沿う。
メモリ帯域幅は中心的焦点で、MTIA 300の6.1 TB/sからMTIA 500の27.6 TB/sへ拡張（約4.5倍）。MTIA 450は主要な商用製品を帯域幅で既に凌ぐとされる。
低精度計算の重視。MX4は500で約30 PFLOPSを達成。推論向けに設計されたカスタムデータ型は、モデル品質を保持しつつスループットを向上させることを目的。
PyTorchネイティブでvLLMサポート（torch.compile、Triton、vLLMプラグイン）。再書き換えなしでGPUとMTIAの両方でモデルを実行可能。MTIA 400は現在データセンターへ出荷済み、450/500は2027年に予定。

MetaはカスタムMTIAチップ（300〜500）の4世代について、約2年の開発で詳細を共有した。

Metaは自前のシリコンを構築し、約6か月ごとに新しいチップを高速に反復している。全体をリデザインすることなく、部品を交換できるモジュール式チップレットを使用。

注目点:

推論優先設計。MTIA 450および500はGenAI推論向けに最適化されており、トレーニングではない。NVIDIAのやり方（トレーニング用に作ってすべてに適用する）は正反対。規模を考えれば筋が通る。
HBM帯域幅のスケーリングは難しい。300の6.1 TB/sから500の27.6 TB/sへ拡張（4.5倍）。メモリ帯域幅はLLM推論のボトルネックであり、MTIA 450はすでに主要な商用製品を帯域幅で凌ぐとされる。
低精度計算を重視。MX4は500で約30 PFLOPSを達成。推論向けに設計されたカスタムデータ型は、推論時にモデル品質を維持しつつスループットを向上させることを意図。
PyTorchネイティブでvLLMサポート。torch.compile、Triton、vLLMプラグイン。再書き換えなしでGPUとMTIAの両方でモデルを実行可能。
時期: MTIA 400は現在データセンターへ出荷、450/500は2027年を目標。

出典: https://ai.meta.com/blog/meta-mtia-scale-ai-chips-for-billions/

submitted by /u/Balance-
[link] [comments]

💡 この記事が使われたインサイト

AIの最新ニュースをまとめた「今日の要点」で、この記事が取り上げられています。

📅 3/19Weeklyインサイトを見る →📅 3/13Dailyインサイトを見る →

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

日経XTECH

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

日経XTECH

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

日経XTECH

世界半導体売上高、単月で初めて800億ドル突破 26年1月

日経XTECH

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供

日経XTECH

Metaが推論に焦点を当てた4つの新しいMTIAチップを発表

要点

💡 この記事が使われたインサイト

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

世界半導体売上高、単月で初めて800億ドル突破 26年1月

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

💡 この記事が使われたインサイト

関連記事

人型ロボットを被災建築物の調査に活用、建築研究所などが公開実験

「ハード回帰にあらず、デバイスはAIの五感と身体」オムロン技術トップ

ホンダEV3車種の開発中止、損失はなぜこれほど膨らんだのか

世界半導体売上高、単月で初めて800億ドル突破 26年1月

TSMC、光電融合でライバル突き放しへ 半導体の設計情報「PDK」を広く提供

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

TSMC、光電融合でライバル突き放しへ半導体の設計情報「PDK」を広く提供