Stable Diffusion は AMD Radeon™ GPU および Ryzen™ AI APUs 向けに最適化されました
Key Takeaways
私たちは AMD と協力して、Stable Diffusion ファミリーの ONNX 最適化版の一部を提供しました。これらは AMD Radeon™ GPU および Ryzen™ AI APUs 上でより高速かつより効率的に動作するよう設計されています。
Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo、Stable Diffusion XL 1.0、および Stable Diffusion XL Turbo の AMD 最適化版が現在 Hugging Face で入手可能で、末尾に「_amdgpu」が付けられています。エンドユーザーは Amuse 3.0 を使用して AMD 最適化モデルを試すことができます。
これらの速度向上の技術的詳細については AMD のブログ投稿 で詳しく確認できます。
私たちは AMD と協力して、Stable Diffusion モデルファミリーの ONNX 最適化版を選択して提供しました。これらは AMD Radeon™ GPU および Ryzen™ AI APUs 上でより高速かつより効率的に動作するよう設計されています。この共同のエンジニアリングの取り組みは、推論性能を最大化することに焦点を合わせつつ、モデル出力の品質やオープンライセンスを損なうことなく行われました。
結果は、ONNX Runtime対応環境のどの環境にも統合できる一連の加速モデルであり、既存のワークフローへそのまますぐに組み込むことを容易にします。Stable Diffusion 3.5 (SD3.5) バリアント、当社の最も高度な画像モデル、または Stable Diffusion XL Turbo (SDXL Turbo) を展開する場合でも、これらのモデルは AMD ハードウェア上でより高速な創作アプリケーションを提供する準備ができています。
生成的ビジュアルメディアの普及が加速する中で、私たちのモデルが主要なハードウェア向けに最適化されていることが不可欠です。この協力は、ビルダーや企業が Stable Diffusion を生産パイプラインへ統合できるようにし、ワークフローをより高速で、より効率的にし、スケール可能にします。
利用可能なモデル
AMD は、SD3.5 と SDXL にまたがる 4 つのモデルを最適化して、性能を向上させました。
SD3.5 バージョン:
AMD 最適化 SD3.5 モデルは、ベースの PyTorch モデルと比較して最大 2.6 倍の推論速度を実現します。
SDXL バージョン:
AMD 最適化により、SDXL 1.0 および SDXL Turbo は、ベースの PyTorch モデルと比較して最大 3.8 倍の推論速度を実現します。

分析は、AMD最適化モデルの推論速度をベースの PyTorch モデルと比較します。テストは Amuse 3.0 RC と AMD Adrenalin 24.30.31.05 KB ドライバー - 25.4.1 プレビューを用いて実施されました。
はじめに
The AMD-optimized Stable Diffusion models are available now on Hugging Face and suffixed with “_amdgpu”. End users can also try out the AMD optimized models using Amuse 3.0.You can learn more about the technical details of these speed upgrades on AMD’s blog post.
今後の進捗情報を随時ご確認いただくには、X、LinkedIn、Instagram でフォローし、Discord Community に参加してください。



