AI Navigate

インサイトインサイト最新記事最新記事一覧 AI大全AI大全カオスマップAIカオスマップ

広告

3x3090（72GB VRAM）でMistral-Medium-3.5-128B-Q3_K_Mを動かした速度

Reddit r/LocalLLaMA / 2026/5/4

💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsTools & Practical UsageModels & Research

原文を読む →

共有:

要点

この投稿は、Q3量子化した「Mistral Medium 3.5 128B」を、NVIDIA 3090を3枚（合計72GB VRAM）使うローカル環境で推論した際の速度を示しています。
パフォーマンスのスクリーンショットや、複数形式での出力レンダリングが含まれており、ベンチマークを実行して応答性を確認したことがうかがえます。
3x3090構成は、量子化（Q3）とマルチGPU分散により、より大きなLLMをローカルで動かすための実用的な方針を表しています。
全体として、新しいモデルの発表ではなく、実際のスループット／レイテンシ挙動に焦点を当てた内容です。

Mistral-Medium-3.5-128B-Q3_K_M on 3x3090 (72GB VRAM)

3x3090でローカル実行しているMistral Medium Q3の実際の速度はこちら

まずは少しPython

https://preview.redd.it/3blnqya7o0zg1.png?width=1670&format=png&auto=webp&s=bab477f9889c16558044ccebb22e3ebfb6a56118

https://preview.redd.it/76a3j6u7o0zg1.png?width=1620&format=png&auto=webp&s=e302a90ae32a7d01959dfee5f7a921dc73ef20b5

https://preview.redd.it/xmd5tzj8o0zg1.png?width=1276&format=png&auto=webp&s=45bc1d77391da81049b6f026dcf6a4af40dc9ec3

次にsvg

https://preview.redd.it/8q5am5alo0zg1.png?width=1594&format=png&auto=webp&s=a7feeb832c17481526838e8488f4be3069f56443

https://preview.redd.it/u4mbv1klo0zg1.png?width=1600&format=png&auto=webp&s=7c83a3437c67ebefe1b0339861f05b9d67c6f030

https://preview.redd.it/e8vw83rlo0zg1.png?width=782&format=png&auto=webp&s=fadb4f04bba756056d38049c465d0f7a4323b66d

次にhtml

https://preview.redd.it/zs9c36xbp0zg1.png?width=1626&format=png&auto=webp&s=428cb84d3158e4285eb4f1d47283646e876f55be

https://preview.redd.it/6dw74a5cp0zg1.png?width=1540&format=png&auto=webp&s=cc5af763d980329c0d98064e4f53265cfdf9ec2f

https://preview.redd.it/4s3zccecp0zg1.png?width=3796&format=png&auto=webp&s=6defbc181dcbee1fe4523559792e1642aaf504f8

https://preview.redd.it/30n07tlcp0zg1.png?width=3782&format=png&auto=webp&s=4ae343f915f4f70e48bc17add7ff856e1af5ceab

投稿者 /u/jacek2023
[リンク] [コメント]

関連記事

Black Hat USA

Black Hat USA

AI Business

【反応の客観視】オファー後の数字に一喜一憂しない。AIに「次の一手」を冷静に導き出させるボトルネック分析プロンプト。

【反応の客観視】オファー後の数字に一喜一憂しない。AIに「次の一手」を冷静に導き出させるボトルネック分析プロンプト。

note

【AI未来予測】測れない知性：ベンチマーク崩壊後のAI評価｜次元ラボ

【AI未来予測】測れない知性：ベンチマーク崩壊後のAI評価｜次元ラボ

note

AIの未来と収益化とAITRPGは同時に達成は可能か？

AIの未来と収益化とAITRPGは同時に達成は可能か？

note

【永久保存版】NotionAI活用術53選 ──自分・自社専用の"最強AI秘書"を育てる完全マニュアル

【永久保存版】NotionAI活用術53選 ──自分・自社専用の"最強AI秘書"を育てる完全マニュアル

note

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。

広告

3x3090（72GB VRAM）でMistral-Medium-3.5-128B-Q3_K_Mを動かした速度 | AI Navigate