Microsoft、音声と画像向けの新しいAIモデル3本でOpenAIに対抗
その提携の中身とは……
Microsoftは木曜日、音声認識、音声合成、画像生成に焦点を当てた、3つの自社開発の機械学習モデルのパブリックプレビュー版を発表しました。
今回のリリースによって、Windows部門は、投資家というよりOpenAIの直の競合に見えるようになりました。レドモンドは昨年10月時点で、約1,350億ドル相当のOpenAI株式を保有していました。
モデルには以下が含まれます。MAI-Transcribe-1は、「主要な代替手段と比べてGPUコストを約50%低く抑えつつ、25言語にわたって企業レベルの精度を提供する」
音声認識モデルです。MAI-Voice-1は、単一のGPUで1秒未満で60秒分の音声を生成できるとされる音声生成モデル。そしてMAI-Image-2は、テキストから画像を生成するモデルで、デジタルアーティストの絶望をさらに増やすものです。
OpenAIもまた、自前の音声認識、音声生成、そしてテキストから画像のモデルを提供しているだけにすぎません。
Microsoftのモデルは、AIエージェントやアプリケーションを開発するためのプラットフォームであるFoundry(旧Azure AI Studio)経由で利用できます。
Microsoft Azure AI Foundry Modelsのプロダクトチームを率いるNaomi Moneypennyは、モデルの到着についてブログ記事で力説しました。
返却形式: {"translated": "翻訳されたHTML"}「これらは、Copilot、Bing、PowerPoint、Azure Speechといった当社自身の製品をすでに動かしているのと同じモデルで、そして今度は開発者が使うために、Foundryで独占的に利用可能になっています」と彼女は書いています。
これらのモデルは、音声を認識して応答を生成できるカスタマーサポート・エージェントの設計など、一般的なエンタープライズのユースケースにうまく適しているように見えます。Moneypennyは、モデルが、大規模なイベントや会議のキャプション付け、メディアの字幕作成とアーカイブ、教育やトレーニング、たとえばフォーカスグループからの顧客・市場インサイトの収集にも役立つだろうとも述べています。
Microsoftはここですでに自社の“オウン・ドッグフード”を食べています。CopilotのAudio ExpressionsはMAI-Voice-1上で動作し、CopilotのVoice Modeの文字起こしサービスはMAI-Transcribe-1を使っています。
開発者は、Azure Speechを通じて、この2つのモデルを試すことができます。
- Microsoftのベテランが語る「アップデートで壊れる」PCの一部は、すでに見切られていた
- Microsoftでさえ、Copilotは重要なことに信頼してはいけないと分かっている
- IBMはAIをより支えるために、メインフレーム上でArmソフトウェアを求めている
- Artemis IIの宇宙飛行士:「Microsoft Outlookが2つあるけど、どっちも動いていない」
MicrosoftがOpenAIとの合意を再交渉したと発表したとき、Windows部門は、少なくとも2032年まではパートナーシップが続く見通しだと示しました。これはAI市場の急激な崩壊が起きないことを前提としたシナリオです。しかし同時に、競争分野も浮き彫りにしました。「Microsoftは、単独でも、または第三者とのパートナーシップによってもAGI[汎用人工知能]を追求できるようになりました」と当時同社は述べています。この声明そのものが、AGI研究という名目のもとで、MicrosoftがAIで自分の道を歩むための自由度を高めています。
Microsoftには、自身の賭けをヘッジする動機があります。OpenAIとのつながりは、1月にMicrosoftの投資家が同社のOpenAIへの多額支出へのエクスポージャーに不満を示したことで、ほころびが見え始めました。AIの誇大広告リーダーである同社は現金を燃やしており、The Informationが公開した社内予測によれば、今年は140億ドルを失うと見込まれています。エンタープライズ顧客に絞った取り組みを合理化するための社内の取り組みは(報道によれば)進行中で、先月末にトークンを焼却するだけで、特に役に立たない動画ジェネレーターのSora 2を停止しました。
2週間前、MicrosoftのCEOサティア・ナデラは、同社のCopilot製品および超知能(スーパインテリジェンス)の取り組みに影響するリーダーシップ変更を発表しました。ジェイコブ・アンドレオは、Microsoftの消費者向けおよび法人向けプロダクトにまたがるEVPとして、同社のCopilot体験を率いるために指名され、ナデラに直接報告します。Copilotは現在、4つの領域に注力しています。Copilot体験、Copilotプラットフォーム、Microsoft 365アプリ、AIモデルです。
おそらく、アンドレオのAIモデルの担当範囲は、単にOpenAIに「どんなモデルがあるか」を確認するだけではないでしょう。そして、Microsoftのモデル構想が十分に明白だったからこそ、ナデラはムスタファ・スレイマンがMicrosoftのAI研究を引き続き主導すると述べました。OpenAIに依存し続けることを目指すなら、まったく不要です。®
より絞り込んだ話題
- アクセシビリティ
- Active Directory
- AdBlock Plus
- AIOps
- アプリ
- アプリケーション配信コントローラー
- Audacity
- Azure
- Bing
- BSoD
- Confluence
- データベース
- DeepSeek
- Devops
- Excel
- Exchange Server
- FOSDEM
- FOSS
- Gemini
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換フォーマット
- HoloLens
- IDE
- 画像圧縮
- Internet Explorer
- Jenkins
- 大規模言語モデル
- レガシー技術
- LibreOffice
- 機械学習
- マップ
- MCubed
- Microsoft 365
- Microsoft Build
- Microsoft Edge
- Microsoft Fabric
- Microsoft Ignite
- Microsoft Office
- Microsoft Surface
- Microsoft Teams
- モバイルデバイス管理
- .NET
- ニューラルネットワーク
- NLP
- Office 365
- OpenOffice
- OS/2
- Outlook
- パッチチューズデー
- プルトン
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロコンピューティング
- 検索エンジン
- SharePoint
- Skype
- ソフトウェア部品表
- ソフトウェアの不具合
- ソフトウェアライセンス
- SQL Server
- スター・ウォーズ
- テンソル処理装置
- テキストエディター
- TOPS
- ユーザーインターフェース
- Visual Studio
- Visual Studio Code
- WebAssembly
- ウェブブラウザー
- Windows
- Windows 10
- Windows 11
- Windows 7
- Windows 8
- Windows Server
- Windows Server 2003
- Windows Server 2008
- Windows Server 2012
- Windows Server 2013
- Windows Server 2016
- Linux向けWindowsサブシステム
- Windows XP
- WordPress
- Xbox
- Xbox 360
関連記事
より絞り込んだ話題
- アクセシビリティ
- Active Directory
- AdBlock Plus
- AIOps
- アプリ
- アプリケーション配信コントローラー
- Audacity
- Azure
- Bing
- BSoD
- Confluence
- データベース
- DeepSeek
- Devops
- Excel
- Exchange Server
- FOSDEM
- FOSS
- Gemini
- Google AI
- GPT-3
- GPT-4
- Grab
- グラフィックス交換形式
- HoloLens
- IDE
- 画像圧縮
- Internet Explorer
- Jenkins
- 大規模言語モデル
- レガシー技術
- LibreOffice
- 機械学習
- 地図
- MCubed
- Microsoft 365
- Microsoft Build
- Microsoft Edge
- Microsoft Fabric
- Microsoft Ignite
- Microsoft Office
- Microsoft Surface
- Microsoft Teams
- モバイル デバイス管理
- .NET
- ニューラルネットワーク
- NLP
- Office 365
- OpenOffice
- OS/2
- Outlook
- パッチチューズデー
- Pluton
- プログラミング言語
- QRコード
- リトリーバル拡張生成
- レトロ コンピューティング
- 検索エンジン
- SharePoint
- Skype
- ソフトウェア部品表
- ソフトウェアのバグ
- ソフトウェアライセンス
- SQL Server
- スター・ウォーズ
- テンソル処理ユニット
- テキストエディター
- TOPS
- ユーザーインターフェイス
- Visual Studio
- Visual Studio Code
- WebAssembly
- Webブラウザー
- Windows
- Windows 10
- Windows 11
- Windows 7
- Windows 8
- Windows Server
- Windows Server 2003
- Windows Server 2008
- Windows Server 2012
- Windows Server 2013
- Windows Server 2016
- Linux 向け Windows サブシステム
- Windows XP
- WordPress
- Xbox
- Xbox 360




