ワイルド・エクスペリエンス - Titan X Pascal

Reddit r/LocalLLaMA / 2026/3/16

💬 オピニオンTools & Practical UsageModels & Research

要点

  • 著者は OpenCode と llama.cpp を用いて Titan X Pascal の古い GPU を AI タスクに試験し、性能を AMD 9070 XT およびサーバーのベースラインと比較した。
  • Titan X Pascal のプロンプト処理は約 500 トークン/秒、生成は約 25 トークン/秒で、9070 XT とほぼ同等だが生成時は遅い。
  • サーバー単体の結果はプロンプト約 100 トークン/秒、生成約 6 トークン/秒で、基準サーバーと比較して GPU が AI タスクを加速する役割を浮き彫りにしている。
  • 結論: 古いハードウェアでも AI ワークロードに対して意外に高いパフォーマンスを発揮できる場合があり、著者は llama.cpp のビジュアルにシンプルなハードウェア指標パネルを追加した。

今日は、古いGPUがAIタスクにどの程度耐えられるかを見てみたいと思っていました。7か月前に、ゲーム用に使っていた AMD 9070 XT について投稿したことがあり、それをAIにも使いたいと思っていました。最近、古い Titan X Pascal のカードをサーバーに追加して、ただ埃をかぶらせているだけでした。

私が眠っている間にコードをレビューする小さな LLM エージェントを動かしていただけでも、それは楽しい実験になると考えました。

OpenCode と llama.cpp のいくつかの調整を行った後、プロンプト処理は約 500 トークン/秒、生成は 25 トークン/秒程度を確認しています。これは 9070 XT が達成したのとほぼ同じですが、生成速度は半分です。 一方、サーバー単体では 100 トークン/秒、生成は 6 トークン/秒程度に留まりました。

学んだ教訓: 古いハードウェアでも依然として驚くほど良い性能を発揮できることがあります。

注: llama.cpp からのハードウェア指標を表示する簡単なパネルを追加しました。指標の追跡にはあまり関心はなく、主に視覚的な要素のためのものです。

https://preview.redd.it/o3xs9461tcpg1.png?width=2468&format=png&auto=webp&s=c7a43fd1e96c4e1e40e58407a55bc64c28db6c92

投稿者: /u/Lazy-Routine-Handler
[リンク] [コメント]