AI Navigate

v0.17.1

vLLM Releases / 2026/3/11

📰 ニュースDeveloper Stack & Infrastructure

要点

  • このリリース v0.17.1 は、前バージョン v0.17.0 に対するパッチアップデートで、コードベースで特定された複数の問題の修正に重点を置いています。
  • trtllm 融合 MoE 実装における NVFP4 と FP8 精度の activation_type の受け渡しに関するバグを修正しています。
  • ゲートなし融合 MoE Triton セットアップのサポートを復旧し、trtllm MoE FP8 バックエンドの EP サポートを再有効化しています。
  • その他の修正には、Mamba および Qwen3.5 モデルの GPU キャッシュ管理の改善、DSV3.2 と MTP コンポーネントのインデクサー処理の最適化が含まれます。
  • これらの対象を絞った修正は、trtllm 融合 MoE および関連する機械学習インフラストラクチャの利用者に対し安定性とパフォーマンスの向上をもたらします。

これは、v0.17.0 の上に適用されたパッチリリースで、いくつかの問題に対処しています:

  • activation_type を trtllm 融合 MoE NVFP4 および FP8 に正しく渡す修正 (#36017)
  • ゲートなし融合 MoE Triton の修正および再サポート (#36412)
  • trtllm MoE FP8 バックエンドの EP を再度有効化 (#36494)
  • [Mamba][Qwen3.5] GPU 上の解放された SSM キャッシュブロックをゼロクリア (#35219)
  • TRTLLM Block FP8 MoE Monolithic の修正 (#36296)
  • [DSV3.2][MTP] インデクサーの MTP 処理最適化 (#36723)