Amazon SageMaker AIでG7eインスタンスにより生成AI推論を高速化
Amazon AWS AI Blog / 2026/4/21
📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageIndustry & Market Moves
要点
- Amazon SageMaker AIで、生成AI推論向けにNVIDIA RTX PRO 6000 Blackwell Server Edition GPUを搭載したG7eインスタンスが提供開始されました。
- G7eノードは1〜8GPU構成でプロビジョニングでき、各GPUは96GBのGDDR7メモリを備えています。
- 今回の提供により、G7e.2xlargeのような単一ノード構成で強力なオープンソースの基盤モデルをホストできます。
- 対象モデルの例として、GPT-OSS-120B、Nemotron-3-Super-120B-A12B(NVFP4バリアント)、Qwen3.5-35B-A3Bが挙げられており、高性能かつ費用対効果の高い選択肢を狙っています。
本日、Amazon SageMaker AI で NVIDIA RTX PRO 6000 Blackwell Server Edition GPU によって駆動される G7e インスタンスが利用可能になったことをお知らせでき、うれしく思います。1、2、4、8 個の RTX PRO 6000 GPU を備えたノードをプロビジョニングでき、各 GPU は 96 GB の GDDR7 メモリを提供します。この提供開始により、単一ノードの GPU インスタンスである G7e.2xlarge を使用して、GPT-OSS-120B、Nemotron-3-Super-120B-A12B(NVFP4 バリアント)、Qwen3.5-35B-A3B などの強力なオープンソースの基盤モデル(FM)をホストすることが可能になります。これにより、組織にとって費用対効果が高く、高性能な選択肢が提供されます。




