AI Navigate

インサイト最新記事一覧 AI大全

Qwen3.5 27B running at ~65tps with DFlash speculation on 2x 3090

Reddit r/LocalLLaMA / 4/7/2026

💬 OpinionDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical Usage

Read original →

共有:

Key Points

Qwen3.5 27Bをローカル環境で動作させ、約65tpsの推論スループットが出ているという投稿が共有された。
設備は2枚のRTX 3090とされ、推論性能を引き上げるための最適化や工夫が前提になっている。
投稿ではDFlash（推論・メモリアクセス系の高速化手法）を使った/使うことでの効果が示唆されており、ボトルネック解消が狙いと考えられる。
ローカルLLMの実行効率を高める「実用寄りの技術的シグナル」として、同構成を検討するユーザーの判断材料になる。

Qwen3.5 27B running at ~65tps with DFlash speculation on 2x 3090

submitted by /u/Kryesh
[link] [comments]

Related Articles

Black Hat USA

Black Hat USA

AI Business

Black Hat Asia

Black Hat Asia

AI Business

VS Code Weekly: AI Gets an Effort Dial and Nested Subagents

VS Code Weekly: AI Gets an Effort Dial and Nested Subagents

Dev.to

Copilot CLI Weekly: /fleet Ships — Parallel Multi-Agent Execution

Copilot CLI Weekly: /fleet Ships — Parallel Multi-Agent Execution

Dev.to

Azure Weekly: Developer Tools Get Smarter, Database Pricing Gets Better

Azure Weekly: Developer Tools Get Smarter, Database Pricing Gets Better

Dev.to

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。