コーディング用のローカルモデルは最適？（RTX5080 + 64GB RAM）

Reddit r/LocalLLaMA / 2026/3/14

💬 オピニオンTools & Practical UsageModels & Research

共有:

要点

RTX 5080 16GB + 64GB RAM DDR5 搭載のPCで動作可能な、ローカルで実行できるコーディング用モデルの中で、許容できる速度と長いコンテキストウィンドウ（32k〜64k）を優先する推奨を探しています。
Cydonia 24B の量子化実験（PC上、いくつかの層を CPU にオフロード）、RAMオフロードの Magnum 70B、約2-2.5 TPS 程度でコーディングタスクには遅いと評価。
MacBook のテスト（FP16 Qwen 3.5 4B、IQ4_XS の Qwen 27B）を参照点として報告、コンテキストサイズ制限とデバイス間のパフォーマンスを指摘。
Windows PC–Mac LAN 構成を提案、PC がモデルをホストし、MacBook がクライアントとして接続して他アプリに影響を及ぼさずに計算を専有。
候補モデル（Qwen 3.5 ファミリー：35B A3B、27B、場合によってはフルウェイトの Qwen 3.5 9B）を評価し、量子化と32k-64k コンテキストの可用性について助言を求める。

TL;DR; コーディング用に、RTX 5080 16GB + 64GB RAM DDR5 で実用的な速度と妥当なコンテキストサイズを満たす、ローカルで実行可能な最適なモデルはどれですか？（正直言うと、16Kのコンテキストサイズでは複数ファイルにまたがるコーディングには不十分ですよね xd）

長文版：

RTX 5080 16GB と 64GB RAM DDR5 を搭えたPCを持っています（AMD 9950x3d CPUと非常に良いマザーボードも付いています。大きな違いはないことは分かっていますが、CPUオフロードの方がわずかに速くなるので参考までに挙げておきます）。

また、MacBook Pro M4 Pro 24GB RAMも持っています（PCがより良いモデルを動かせる可能性があることを認識しているので、参考までに）。

私はこの両方のマシンを、ローカルでモデルを動かしてロールプレイに使ってきたので、何が合理的に動作するかをある程度知っています。また、RAMへどの程度の層をオフロードしても目立った速度低下がないかも把握しています。例として、PCで Cydonia 24B を量子化して実行していたところ、いくつかの層を CPU にオフロードせざるを得ませんでしたが、それでも非常に速く動作しました（ただしコンテキストはかなり小さく 16k）。また Magnum 70B を一度 Q4 か Q5 のどちらかで動かそうとしましたが、半分以上の層を RAM にオフロードしました。小さなコンテキストでも、速度はおおよそ 2-2.5 TPS で、コーディング作業としては受け入れ難いものでした :P

MacBook ではモデルを多くいじってはいませんが、 FP16 Qwen 3.5 4B を実行してスムーズに動作しました。また IQ4_XS で Qwen 27B を実行してみましたが、こちらもかなり良好でした。ただし kv キャッシュの余裕が少し残っていたため、コンテキストサイズはあまり大きくありませんでした。

したがって、最善の方針は Windows PC 上でモデルを実行し、MacBook で LAN 経由で接続することだと考えています（これが私がコーディングに使っている方法であり、コーディング/他のアプリの実行に計算資源を奪われる心配がなく、PC はモデルだけを実行し他のことは何も行わない状態にできます）。

私はプロの開発者で、職場では Opus 4.6 や GPT 5.4 の高い思考を無制限に使える環境に慣れていますが、現実にはローカルでこれだけの品質を得るのは難しいのが残念です（ XD ）

ただし、ロールプレイのおかげでローカル/クラウドAIにより関心が高まっており、それをコーディングにも活かせるのではないかと考え始めました。まだ何のためか分かっていませんが、誰にも使われないような別のアプリをコーディングするための趣味のようなプロジェクトではなく、少し試してみて、ローカル環境でどれくらい良くなるかを見たいのです。

私は主に新しい Qwen 3.5（例: 35B A3B や 27B）を検討していましたが、量子化するとコーディング能力が非常に低下すると聞いており、ローカルでフルウェイトで実行することは難しいでしょう。おそらくフルウェイトの Qwen3.5 9B を動かせるかもしれませんが、それが十分かどうかは分かりません。

私にとって重要なのは：

- モデルが少なくとも2ファイル以上に跨って作業できること（したがってコンテキストサイズは妥当であるべきで、少なくとも32k、できれば64k以上が望ましい）

- It has to be a

AIにイラスト作成を依頼するのは意外と難しい

note

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

note

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

時代劇のエンディング・テーマを目指したんですが。〜Sunoで作曲〜

note

鳴かず飛ばずの過去記事が蘇る。AIに「今の時代に刺さる切り口」でリライトさせる錬金術。【コピペOK】

note

コーディング用のローカルモデルは最適？（RTX5080 + 64GB RAM）

要点

関連記事

AIにイラスト作成を依頼するのは意外と難しい

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

時代劇のエンディング・テーマを目指したんですが。〜Sunoで作曲〜

鳴かず飛ばずの過去記事が蘇る。AIに「今の時代に刺さる切り口」でリライトさせる錬金術。【コピペOK】

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

AIにイラスト作成を依頼するのは意外と難しい

裏カツ 奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

時代劇のエンディング・テーマを目指したんですが。 〜Sunoで作曲〜

鳴かず飛ばずの過去記事が蘇る。AIに「今の時代に刺さる切り口」でリライトさせる錬金術。【コピペOK】

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

裏カツ奏 #AIイラスト #画像生成AI #アート #イラスト #生成AI #美女イラスト #創作 #クリエイター #イラストレーター

時代劇のエンディング・テーマを目指したんですが。〜Sunoで作曲〜