AI Navigate

Stability AI、エンタープライズ規模のサウンド制作向けに設計された初のオーディオモデル Stable Audio 2.5を発表

Stability AI Blog / 2026/3/21

📰 ニュースTools & Practical UsageModels & Research

要点

  • Stability AIは、大規模なエンタープライズ向けサウンド制作のために構築された初のオーディオモデルとして位置づけられるStable Audio 2.5を公開しました。
  • このモデルは大量生産規模のオーディオ作業を対象とし、複雑なワークフロー全体で一貫した品質を実現することを目指しています。
  • 本発表は、エンタープライズ級のオーディオツール領域への進出を示すもので、既存の制作パイプラインやコンテンツ制作システムへの統合を実現する可能性があります。
  • この動きは、商用利用向けのスケーラブルなAI生成サウンドを可能にすることで、音響スタジオ、メディア企業、開発者に影響を及ぼす可能性があります。

Stability AIは、エンタープライズ規模のサウンド制作のために構築された最初のオーディオモデルStable Audio 2.5を発表します

要点:

  • Stable Audio 2.5をローンチします。エンタープライズ級のサウンド制作を念頭に置いて特化して設計された、初の音声生成モデルです。

  • カスタマイズされたサウンドはブランドの未開拓の差別化要因です。企業は広告から店頭体験まで、増え続けるチャネルの幅に対して独自のサウンドを作り出す必要があります。

  • Stable Audio 2.5は、大規模化におけるカスタマイズ可能で高品質なオーディオの作成というこの課題に特化して設計されています。これには、高度な音楽的構成、GPU上で2秒未満の高速推論、そしてオーディオ・インペインティングによるより多くの制御のサポートが含まれます。

  • Stable Audio 2.5を今すぐ試すには StableAudio.comで、またStability AI APIを介してシームレスにデプロイしてください。 fal、Replicate、ComfyUIなどのパートナープラットフォーム、そしてエンタープライズライセンスでのオンプレミス展開も可能です。

Stable Audio 2.5の最新の音声モデルで、企業向けユースケースに対応する初のモデルとしてリリースできることを嬉しく思います。Stable Audio 2.5 は、品質とコントロールの向上を実現し、カスタムブランドのニーズに合わせて適応できるダイナミックな構成の需要に対応します。

カスタムオーディオはブランドを8倍も記憶に残りやすくしますが、 Ipsosの調査によれば、クリエイティブな用途で音声アイデンティティを使用しているのはわずか6%です。ブランドを拡張として音声をより戦略的に活用するには、企業は高品質で商用グレード、さまざまな場面で適応できる音声を作る必要があります。 

Stable Audio 2.5 の企業向け機能により、プロのクリエイティブチームはより高度でカスタマイズ可能な音声生成を活用して、すべての制作に適切なサウンドを提供できます。

新機能: 生成の高速化、よりスマートな構成、強化されたワークフロー

Stable Audio 2.5 は、速度と出力品質の向上を実現し、商用のユースケースに適しています。

  • 数秒で3分間のトラックを生成: 最先端の Adversarial Relativistic-Contrastive (ARC) 手法を Stable Audio 研究チームが開発した事後訓練を用いており、Stable Audio 2.5 は GPU 上で3分までのトラックに対して推論速度が2秒未満です。 

  • ダイナミックな音楽構成を生成: Stable Audio 2.5 は音楽向けに最適化され、より高度な音楽構造を持ち、イントロ、展開、アウトロの複数パートの構成を生成します。モデルはプロンプトの適合性も向上し、ムード記述子(例:「 uplifting 」)やジャンル横断の音楽言語(「豊かなシンセサイザー」など)に対する応答性がより高くなっています。

  • オーディオインペインティング機能でより細かなコントロールを取得: テキストツーオーディオおよびオーディオツーオーディオのワークフローに加え、Stable Audio 2.5 はオーディオインペインティングをサポートします。つまり、ユーザーは自分のオーディオを入力し、開始地点を選択すると、モデルが文脈を用いて残りのトラックを生成します。注: サービス利用規約ではアップロードが著作権で保護された素材を含まないことを求めており、私たちは高度なコンテンツ認識を用いて遵守と侵害防止を維持します。

すべての Stable Audio モデルと同様に、 Stable Audio 2.5 は商用利用に安全で、完全にライセンスされたデータセットで訓練されています。

"/>

創造的なコントロールとパートナーシップを備えた、カスタムでブランド主導のオーディオを作成

オーディオはブランドエンゲージメントに86%の影響を与えますが、規模でカスタムオーディオを活用しているブランドは多くありません。企業は、広告、ゲームのオープニングクレジット、店舗内の音楽、クレジットカードのスワイプ音、車のステレオなど、拡大するさまざまなタッチポイント全体で、より意図的でブランドに沿った音声をキュレーションする機会があります。

企業が適切なサウンドを作成できるよう、当社のチームは組織のサウンドライブラリに合わせて Stable Audio のモデルを微調整し、ブランドの特徴的なオーディオをカスタム生成ワークフローに組み込みます。これにより、音楽やサウンドスケープがブランドのソニックアイデンティティやプロジェクトのクリエイティブガイドラインの一部として、独自に認識されることが保証されます。

Stable Audio 2.5 のリリースに伴い、Stability AI は Landor Group の一員である大手サウンドブランディングエージェンシー amp、WPP 社のグループに属する、革新的なブランドがアイコニックなサウンドアイデンティティと体験を創出するためのエンタープライズソリューションを共同開発します。Stable Audio 2.5 は WPP Open を通じて WPP のグローバルクライアントベースに提供され、先進技術とクリエイティブな専門知識を組み合わせます。

はじめる

今すぐ Stable Audio 2.5 をお試しいただけます。StableAudio.com。 

Stable Audio 2.5 は、Stability AI API を通じて利用可能です。さらに、fal、Replicate、および ComfyUI などのパートナープラットフォームにも対応しています。

自社のインフラストラクチャ上で当社のオーディオモデルをデプロイすることに関心のある企業の方は、実装サポート、カスタマイズオプション、専門サービスを提供する Enterprise Licensing についてご相談ください。特定のユースケースに合わせたオーディオモデルとワークフローのカスタマイズについて詳しく知るには、Stability AI Solutions をご覧ください。

進捗情報を随時受け取るには、 X LinkedIn Instagram、と私たちのDiscord Communityに参加してください。