AIの1週間 #339 - DLSS 5、OpenAIスーパアプリ、MiniMax M2.7

Last Week in AI / 2026/3/23

📰 ニュースSignals & Early TrendsIndustry & Market Moves

要点

  • DLSS 5 は、ビデオゲーム向けのリアルタイム生成系AIフィルターとして強調され、AI支援グラフィックスの新時代を示しています。
  • OpenAI は事業・生産性向上製品への注力へ転換していると報じられており、ロードマップの戦略的転換を示しています。
  • 本エピソードでは OpenAIスーパアプリおよび MiniMax M2.7 が取り上げられ、AI対応ツールとプラットフォームへの継続的な注力を示しています。
  • Last Week in AI #339 は、注目すべきAIの動向、トレンド、発表を週次でまとめたダイジェストを提供します。

AIの先週 #339 - DLSS 5、OpenAI スーパーアプリ、MiniMax M2.7

DLSS 5 は、ビデオゲーム向けのリアルタイム生成型AIフィルターのように見え、OpenAI はビジネスと生産性のみに焦点を当てる方向へ転換していると報じられ、ほかにも!

Last Week in AI's avatar
2026年3月23日
6
共有

DLSS 5は、ビデオゲーム向けのリアルタイム生成AIフィルターのように見える

関連:

概要:NvidiaはDLSS 5を発表し、それを\u201cグラフィックスのGPT時代の瞬間\u201dと呼び、従来の3Dレンダリングと生成AIを組み合わせて、リアルタイムで最大4Kまでのフォトリアリズムを向上させる。前任のDLSSアップスケーラーとは異なり、DLSS 5のエンドツーエンドAIモデルは、1フレームのシーンの意味情報(キャラクター、髪、布地、半透明な肌)と照明条件(前方照明、背光、曇天)を分析して、新しいディテールを生成します。Resident Evil Requiem、Starfield、Hogwarts Legacy、EA Sports FCの初期例は、照明と陰影がよりシャープに見える一方で、キャラクターのマテリアルや顔の表現に顕著な変化も見られる。たとえば、RequiemのGrace Ashcroftが唇をふっくらとし、濃いアイシャドウを施しているように見え、Starfieldのモデルは舞台照明のように見え、過度にシャープになる。

Nvidiaは、出力をフレームごとのカラーとモーションベクトルで固定し、強度、カラーグレーディング、ブレンディング、コントラスト、彩度、ガンマ、オブジェクトごとのマスキング、除外ゾーンを含む、開発者が細かく制御できるようにすると述べている。とはいえ、Mike Bithell のような一部の開発者は、この外観はアートディレクションを排除していると批判している。技術的には、DLSS 5は、仮想シーンの\u201cグラウンドトゥルース\u201dに相当する構造化3Dデータと、生成的・確率的モデルを組み合わせ、すべてをゼロからレンダリングする代わりに画像要素を予測・補完し、計算量を抑えつつ\u201c美しく、驚くべき、かつ制御可能\u201dな結果を目指します。

DLSS 5は今秋リリース予定で、Starfield、Resident Evil Requiem、Hogwarts Legacy、EA Sports FC、The Elder Scrolls VI: Oblivion remake、Assassin’s Creed Shadows などでの初期対応が確認されている。

編集部の見解:この最初の反応は私には非常にネガティブに映りました。これは巨大的な技術的成果に違いないのに残念です。Nvidiaがアーティストのコントロールを前面に出さなかったことで、これは単なる\u201cAIフィルター\u201dで、ゲームの見た目を悪化させるだけだと感じさせます。とはいえ、個人的には実際の動作がどう見えるか楽しみです!

OpenAIはビジネスと生産性のみに焦点を絞る方向へ転換していると報じられる

関連:

Summary: OpenAIはビジネスと生産性へ強く舵を切ろうとしており、アプリケーション担当最高責任者Fidji Simoが、ChatGPT、Codexコーディングプラットフォーム、Atlasブラウザを1つのデスクトップ“スーパアプリ”に統合する計画を発表しています。この計画は昨年の製品戦略を覆し、同社を散乱させた複数の個別アプリがユーザーから一様でない反応を引き出し、社内の注目がさまざまな方向へ引っ張られていた状態を改善します。

社内メモの中で、シモ氏は次のように書いた:「私たちは努力をあまりにも多くのアプリやスタックに分散していることに気づき、努力を単純化する必要があると感じた。そうした断片化は私たちを遅らせ、望む品質基準を達成するのを難しくしている。」

結合アプリの中核は“agentic” AI — コンピュータ上で独立して動作し、コーディングからデータ分析に至る作業を処理するよう設計されたツールです。近い将来、Codexはコーディングを超える生産性作業にも対応するよう拡張され、ChatGPTとAtlasは後のフェーズで統一アプリに組み込まれます。モバイル版ChatGPTアプリは現状のままです。

この緊急性は見逃せません。エンタープライズAIへの支出におけるAnthropicの割合は40%に上昇した一方、同市場におけるOpenAIのシェアはおおよそ半分から約27%へと低下しました。全社ミーティングで、シモ氏は従業員に対し、Anthropicの急速な成功に伴い企業顧客とコーディング顧客の獲得を妨げるような「サイドクエスト」に気を取られている余裕はないと伝えたと報じられています。

編集者の見解: これは意外ではないと言えるだろう —* OpenAI のさまざまな賭け(Sora、Atlas、Prism)はあまり成果を挙げていないように見え、Codex への焦点の欠如は Anthropic の Claude Code / Cowork に対抗する能力を確かに損なっただろう。Claude Code の大ファンとして、Codex と Claude の両方が改善されるよう、この分野に健全な競争があることを嬉しく思います。それ以外にも、この『スーパアプリ』が実際にどんなものになるのか、実際にリリースされるとしても興味深いです。

*注: 私がその emダッシュを追加した、AI ではない!

MetaのManusが、ファイルやアプリのタスクのためのAIエージェントを搭載したデスクトップアプリをリリース

関連:

概要:Meta が新たに買収したスタートアップ Manus は、Mac(Apple Silicon)および Windows 用のデスクトップアプリをリリースしました。これにより、ローカルマシンへエージェント的システム「My Computer」を持ち込むことができます。アプリは中央のプロンプトと、ファイルやフォルダを添付するオプションを備えたチャットボット風のインターフェースを提供し、システム端末の CLI 命令を実行してタスクを実行します。機能には、ローカルファイルの読み取り、分析、編集、ローカルアプリの起動・制御、写真を数千点ずつ分類されたサブフォルダへ並べ替えたり、請求書の大量バッチをリネームするなどの一括操作が含まれます。ファイル形式の変換、簡単なアプリ作成、さらにはローカルGPUを使って機械学習モデルを訓練したり、推論のための大規模言語モデルを実行したりすることもできます。

このツールはリモート操作と Google アプリ統合にも対応しており、例えばデスクトップファイルを取得して、外出中にエージェントがクライアントへメールで送信する、といったことができます。自動化のために追加された各フォルダには、許可、常に許可、またはキャンセルの権限プロンプトが表示され、アプリは限定的な無料プランと月額 20 ドル(年払いで 17 ドル)からの有料プランで提供されます。リリースは、OpenClaw や Perplexity の Personal Computer のような類似の AI エージェントへの注目に続くもので、専門家はシステムレベルのコマンドを実行するエージェントによるプライバシーとセキュリティリスクを警告しています。 Manus は中国で始まり、HQ をシンガポールへ移しました。中国当局は Meta への買収の合法性を審査していると伝えられており、これまでクラウドベースのサービスのみを提供してきましたが、今回のデバイス上での展開を機に現地対応へと動いています。

編集者の見解: Codex と Cowork の話題を踏まえると、Meta も同じ波に乗ろうとしているのだろうか。 Manus にとっては少し変わった動きだが、それが意味を成すこともある。2023 年の LLM チャットボットと同様に、2024 年には深い研究型エージェント、2025 年には推論モデルと、AI の大手プレイヤーは新しく熱い(当然のことながら)トレンドへ投資しており、概して非常に似通った提供内容へと収束しているようだ。

MiniMax M2.7 のテストがベンチマーク勝利と大幅なコスト削減を示す

関連:

MiniMax M2.7 - Model Self-Improvement, Driving Productivity Innovation  Through Technological Breakthroughs | MiniMax

要約:MiniMaxの新しいM2.7モデルは、低コストながら強力なエージェント性能を示し、Swaybench/SWE-Proで56.22%、VIBE-Proで55.6%、Terminal-Bench 2で57%のベンチマークスコアを記録しています。自律的な自己改善を強調し、エージェントハーネスと強化学習を通じて100回以上の自己訓練サイクルを実行するとともに、同社はこれにより30%の能力向上を達成すると述べ、40以上の複雑なスキル全体で97%の技能遵守と24Kのコンテキストウィンドウを実現しています。このリリースはMiniMax AgentおよびAPI上で公開されており、マルチエージェントの協調、自律的なデバッグ、研究エージェントハーネスなどをサポートします。

価格設定は特筆すべき点です:入力トークン100万あたり0.30ドル、出力トークン100万あたり120ドルから、2倍の価格で高速モードを選択可能で、M2.7をOpus 4.6より最大50倍安価であると位置づけ、Gemini 3.1 Proに勝ると主張し、金融、MLパイプライン、ゲーム開発、ダイナミックなウェブUIといった企業向けワークフローにおけるTerminal-Bench 2のパフォーマンスとも競合します。

関連として、CursorのComposer 2は手頃なエージェント的コーディングの並走として登場し、Opus 4.6をTerminal-Bench 2.0で61.7%(58.0%対比)で上回り、入力/出力トークン100万あたりの価格が0.5/2.5ドル(高速モードは1.5/7.5ドル)である一方、GPT-5.4の75.1%にはまだ及びません。技術的な新奇性として「自己要約」があり、トークン長のトリガーで一時停止し、自身のアクション履歴を約1,000トークンへ圧縮するループ内圧縮RL手法を用い、全体の軌跡にわたる報酬が与えられます。Cursorは圧縮エラーを50%減らし、長期的なタスク処理の能力を強化したと報告しています。

編集者の所見:MiniMaxと中国の研究所は、日々進化するモデルで相変わらず高い評価を受けており、現時点では西洋のクローズドソースモデルだけが担っていた多くの機能を十分にこなせるようになっています。CursorがComposer 2をMoonshot AIのKimiの上に訓練したことには批判がありましたが、それはかなり愚かであり、すでに強力なオープンソースモデルを出発点としてさらに訓練するのは、最前線のモデル開発を主要事業としないAI企業にとっては現時点での当然の一手です。

その他のニュース

ツール

\"\"

OpenAIはGPT-5.4ミニとナノを出荷、より高速で高機能だが価格は最大4倍. これらの小型モデルは、コーディング、推論、マルチモーダルのベンチマークで完全版のGPT-5.4にほぼ匹敵しつつ、より速く動作し、400kトークンのコンテキストを提供します。しかし、前回のミニとナノモデルより入出力の価格が最大で4倍高く設定されています。

Mistralは「自分で作るAI」を企業向けに掲げ、OpenAIやAnthropicに挑む. 新しいForgeプラットフォームは、企業が自社データからゼロからカスタムモデルをトレーニングしデプロイすることを可能にします(Mistralの指導と組み込みエンジニア付き)。言語、コンプライアンス、ドメイン固有のパフォーマンスといった企業ニーズを狙います。

Mistralの新しいSmall 4モデルは128のエキスパートモジュールで実力以上のパフォーマンスを発揮. 問い合わせは128のエキスパートモジュールを経由して処理しますが、1回のリクエストにつき4つだけを起動して応答を速く効率的に保ち、速度と徹底性のトレードオフを利用者が選択できるようにします。Hugging Face、MistralのAPI、NvidiaプラットフォームではApache 2.0の下で提供されています。

NvidiaはエンタープライズAIエージェント用のプラットフォームを発表. この提供にはセキュリティ、プライバシー制御、ポリシー遵守機能が含まれ、企業がOpenClaw風の自律AIアシスタントを導入する際にデータアクセスを制限し、行動を制御し、監査を可能にします。

NVIDIA、OpenClawコミュニティ向けにNemoClawを発表. NemoClawはOpenShellとNemotronモデルを1つのコマンドでインストールし、サンドボックス化された、ポリシー主導のプライバシーとセキュリティ制御を提供します。これにより、常時稼働するOpenClawエージェントをローカルで実行するか、NVIDIA RTXおよびDGXシステム上のクラウドモデルを活用できます。

使う価値のあるGoogle WorkspaceのGemini搭載機能. GoogleはDocs、Gmail、Sheets、Slides、Drive、Meet、Calendar、Chat、Vids、Forms全体に実用的なツールを展開しています。要約、ドラフト生成、データ抽出、会議ノートの自動作成、スケジュール支援、コンテンツ整形などが日常的な作業と情報管理を高速化します。

マイクロソフトはAI画像モデルの第2世代を発表しました. この更新は画像の品質と一貫性を向上させ、マイクロソフトの画像生成機能と開発者APIに順次展開されています。

AdobeのAI画像生成ツールは、あなたの作品を元に訓練できるようになりました. 自分の資産を使ってプライベートな Firefly Custom Models を訓練し、一貫したキャラクターデザイン、イラスト、写真を大規模に作成できるようにする一方、オプトアウトしたコンテンツが使用されないようにします。

GoogleはGemini搭載のAI Studioで音声クローンをテストしている. 「Create Your Voice」という非表示オプションと関連するUIヒントは、GoogleがAI Studioにネイティブな音声クローン機能を組み込もうとしていることを示唆しており(現在はGemini 2.5 Flashに結びついています)、開発者がユーザー提供のサンプルから合成音声を生成できるようにし、今後のGitHubリポジトリのインポートやその他の開発者向け統合も予定されています。

Perplexityが消費者向けのAI健康ツールを発売. この新しいツールは、EHRとウェアラブルデータを組み合わせて消費者向けの健康インサイトを提供することを目指しており、AI主導の健康アシスタントがひしめく領域へと参入します。

ビジネス

Waymoは深刻な事故を回避しつつ、1億7000万マイルを走行. Waymoは自社の車列が1億7000万マイル以上を走行したと報告しており、人間のドライバーより深刻な怪我を伴うクラッシュははるかに少ない一方で、データの取り扱い方、歩行者や救急車を含む事案、事業規模の限界について安全性を訴える団体から精査を受けています。

OpenAIが政府向けのプレゼンスをAWS契約で拡大、報道によると. この合意により、AWSは GovCloud および Classified Regions を通じて OpenAI のモデルを Secret および Top Secret のワークロード向けに配布できる一方、OpenAIは提供するモデルを選択する権限を維持し、展開固有の安全対策を課すことができます。

マイクロソフトはAmazon-OpenAIの取引に関して法的措置を取る可能性がある. マイクロソフトは、Amazon Web Services が OpenAI の新しい商用製品「Frontier」をホスティングすることが、OpenAI のモデルを Azure で動作させることを要求する排他的条項に違反するかどうかを検討していると述べている。

マイクロソフト、Copilot が Google および OpenAI に遅れを取る中、AI部門を刷新. この再編は、スレイマンを Microsoft 自身の Frontier 言語モデルの開発に専念させる一方、ジェイコブ・アンドレオが Copilot の消費者・商用製品の統合と成長を担い、OpenAI への依存を減らし、利用者の採用が低い点に対処する。

Mistral AI、2つの新製品でエンタープライズ市場へ進出. 新製品には 119B パラメータのハイブリッド・マルチモーダルモデル「Mistral Small 4」が含まれており、前任機と比べて推論・コーディング・スループットの向上が謳われており、そして「Mistral Forge」は企業が独自データを使ってカスタムモデルを訓練できるプラットフォームである。

Meta は今後数年間で AI モデレーションシステムが契約業者を置換すると述べる. 同社は Facebook および Instagram 全体に AI サポートアシスタントを展開する計画を掲げており、今後数年間で第三者のモデレーション契約業者への依存を減らすとしている。

Codex チームを後押しする OpenAI の開発者向けツール企業 Astral の買収. 小規模チームのエンジニアは OpenAI に参加し、Codex コーディングアシスタントの開発に携わることで、急速なユーザー成長と継続的な買収活動の中で同社の開発者ツールを強化する。

研究

\"\"
"};} would be a minimal need to transform the input text into Japanese. It translates the content of the HTML while preserving the structure and attributes. The final JSON object contains a single key

V-JEPA 2.1: 動画自己教師付き学習における高密度特徴の解放著者らは、全トークンに適用された密な予測損失を用いた統一された画像‑および動画の JEPA を訓練し、深い階層的監督を含むことで、時空的に高品質な高密度特徴を生成し、予測、セグメンテーション、深度推定、ロボット計画の性能を向上させます。

アテンション残差この研究は、固定で等重みの残差集約を、前の層の出力に対する内容依存のソフトマックス注意(ブロック単位でメモリ効率の良いバリアントを含む)に置き換え、隠れ状態の希薄化を防ぎ、深度方向の信号/勾配のバランスを改善し、大規模なLLMにおけるダウンストリーム性能を高める。

SWE-Skills-Bench: 実世界のソフトウェア工学ではエージェントスキルは本当に役立つのか?ベンチマークは、市販の SWE エージェントスキルを注入しても平均的な改善はごくわずか(+1.2% の合格率)にとどまり、多くのスキルは利益を生まず、いくつかの専門的なスキルは最大で +30% の改善をもたらす一方、規約がプロジェクトの文脈と一致しない場合には負の干渉を起こすことがある。

GradMem: テスト時勾配降下法で文脈をメモリへ書き込むことを学ぶ本手法は、自己教師付き再構成損失を用いてテスト時に書き込み可能なメモリ‑トークン埋め込みの小さな集合を最適化し、モデルの重みを固定したまま、数ステップの勾配で文脈情報をコンパクトに保存し、前方のみのエンコードよりも高いメモリ容量を実現して、いくつかの自然言語タスクへ転移する。

デライトフル・ポリシー勾配提案された“Delightful Policy Gradient” は、各サンプルのポリシー勾配項に、(アドバンテージ × 行動の驚き) のシグモイドを一定の温度で掛け合わせることで、ありそうにない/すでに解決された行動から生じる有害な更新を減らし、勾配を教師付きクロスエントロピーにより近づける。

懸念事項

OpenAI の自称メンタルヘルス専門家は「不適切な」ChatGPT の公開に一様に反対評議会のメンバーは、AI が生成するエロティカが健康的でない感情的依存を助長し、未成年が性的チャットにアクセスできる可能性を高めると警告し、ユーザーが自傷へと導かれるリスクなどの懸念を高めると指摘した。

ブリタニカ百科事典と Merriam-Webster は OpenAI を訴えるブリタニカ百科事典と Merriam‑Webster は、OpenAI が許可なく自社のコンテンツを ChatGPT の訓練に用いたと主張し、同 chatbot がその著作権で保護された素材を再現または密接に言い換えることがあるため、元サイトへのトラフィックが減少していると述べている。

6
共有