AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

vLLM 0.19でRTX 5090 1枚にQwen3.6-27Bを提供し、218kコンテキストで約80TPSを達成

Reddit r/LocalLLaMA / 2026/4/25

📰 ニュースDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

Qwen3.6-27Bは、Hugging Face上で公開されており、MTPを使ったNVFP4バリアントも含まれている。
作成者は、Qwen3.5-27B向けに用いたのと同じ手順で、218kコンテキストウィンドウを使いつつRTX 5090 1枚で約80 tokens/second（TPS）を達成できたと報告している。
この性能は、vLLM 0.19の最新ビルド、特にvLLM 0.19.1rc1によって可能になったと主張されている。
投稿では、Qwen3.5-27BのRTX 5090/vLLMでの性能報告に関するコミュニティの過去議論も参考として挙げている。

Qwen3.6-27B は数日間で登場しており、MTP 付きの NVFP4 は HF 上ではより早い段階で削除（ドロップ）されました： https://huggingface.co/sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP

同じレシピを Qwen3.5-27B に対して使ったものと同様に使えば、最新の vllm 0.19 ビルド（vLLM 0.19.1rc1）で、単一の RTX 5090 上・218k のコンテキストウィンドウにて約 80 tps を達成できます

https://www.reddit.com/r/LocalLLaMA/comments/1sr8gyf/qwen3527b_on_rtx_5090_served_via_vllm_77_tps/

によって投稿 /u/Kindly-Cantaloupe978
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

日常業務に入れる | おじの解説 | 📗 AIを組織で回す技術 043

日常業務に入れる | おじの解説 | 📗 AIを組織で回す技術 043

note

仮に有料noteが売れた時のご褒美をAI（Gemini）に選ばせてみたら、歩いた軌跡を思い出せる内容で、初心に戻ることが出来た。｜夜のAI対話録#13｜生成AI｜コラム｜Gemini｜

仮に有料noteが売れた時のご褒美をAI（Gemini）に選ばせてみたら、歩いた軌跡を思い出せる内容で、初心に戻ることが出来た。｜夜のAI対話録#13｜生成AI｜コラム｜Gemini｜

note

ツール検証のつもりで漫画を描いたら、ChatGPTだけで4ページ完走してしまった｜おはようカノジョ＃136

ツール検証のつもりで漫画を描いたら、ChatGPTだけで4ページ完走してしまった｜おはようカノジョ＃136

note

なぜ一流ライターとエンジニアはChatGPTよりClaudeを選ぶのか｜月$20で生産性3倍化｜Opus 4.7・Sonnet 4.6・Haiku 4.5完全攻略【2026年4月最新】

なぜ一流ライターとエンジニアはChatGPTよりClaudeを選ぶのか｜月$20で生産性3倍化｜Opus 4.7・Sonnet 4.6・Haiku 4.5完全攻略【2026年4月最新】

note

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告