LWiAI Podcast #238 - GPT 5.4 mini、OpenAIの方向転換、Mamba 3、注意残差
アンドレイからのメモ:この回はRSSでは1週間前に公開されていましたが、YouTubeへの投稿が遅れてしまい、そのためSubstackでも同様に遅れました。ごめんなさい!
AIの先週の大きなニュースをまとめた解説と議論でお届けする、238回目のエピソードです!
収録日:03/18/2026
司会: アンドレイ・クレネンコフ および ジェレミー・ハリス
ご質問やフィードバックは、andreyvkurenkov@gmail.com および/または hello@gladstone.ai
今回の内容:
* OpenAIは、400kトークンのコンテキストウィンドウを備えた GPT-5.4 mini と nano をリリースしました。1トークンあたりの価格はより高いものの、Codexではトークン効率の向上をうたっています。nanoはAPI専用で、大幅な価格上昇にもかかわらず、高ボリュームの分類/データ抽出向けとして提案されています。
* Mistralは、小型4モデルファミリー(MoE、総計119B/アクティブ6B)をオープンソース化しました。推論、マルチモーダル、コーディング・エージェント能力を組み合わせており、さらにForgeを発表。これにより企業はカスタムモデルの学習、または追加学習(ポストトレイン)を支援できるとしています。
* エージェントの「オペレーティングシステム」競争が激化しました。Metaが買収したManusがローカルMacエージェント「My Computer」を立ち上げ、NvidiaはNeMo/「Open Shell」としてサンドボックス化されたエージェント実行ランタイムを発表しました。さらにNvidiaはDLSS 5に加え、Groq LPUの統合を含む主要なハードウェア予測も明らかにしています。
* ビジネスと安全に関するアップデートには、競争の中でOpenAIが生産性/エンタープライズ重視へと焦点を移したこと、MicrosoftがCopilotとフロンティア・モデルの取り組みを再編したこと、Metaが次のモデルの公開を延期したこと、中国に関連するByteDanceが海外で大規模なNvidiaクラスタを展開したこと、ならびにステガノグラフィー、チェーン・オブ・ソートの忠実性、ファインチューニング防御、サイバー攻撃の評価、憲法/仕様の順守に関する新しい安全性作業が含まれます。
現在のスポンサーへの感謝:
Box - Box.com/AI にアクセスして詳細を学びましょう
ODSC AI - odsc.ai/east にアクセスし、プロモコード LWAI を使用すると、ODSC AI East 2026 のパスがさらに15%オフになります。
Factor - factormeals.com/lwai50off にアクセスし、コード lwai50off を使って、50%オフに加えて1年間の無料朝食をもらいましょう
タイムスタンプ:
(00:00:10) オープニング / 雑談
(00:01:56) ニュース予告
ツール & アプリ
(00:02:39) OpenAIはGPT-5.4 mini と nano を提供開始。より高速で高性能だが、最大4倍高くつく
(00:08:04) Mistralの新しいSmall 4モデルは、128のエキスパートモジュールで“実力以上”を見せる
(00:14:03) MetaのManusが「My Computer」を発表し、MacをAIエージェントに変える - 9to5Mac
(00:17:57) NVIDIAはOpenClawコミュニティ向けにNemoClawを発表 | NVIDIA Newsroom + NvidiaはOpen Agent Development Platformで知識労働を強化
(00:24:09) DLSS 5は、ビデオゲーム向けのリアルタイム生成AIフィルターのように見える | The Verge
(00:26:36) OpenAIは、自社のアドバイザーからの警告にもかかわらずChatGPTの「アダルトモード」を提供へ - CNET
アプリケーション & ビジネス
(00:33:46) OpenAIが“ビジネスと生産性”にのみ注力する方向へ舵を切っていると報道
(00:41:25) Nvidia GTC 2026:CEOジェンセン・ファンは、ブラックウェルとヴェラ・ルービンについて’27までに10億ドル規模の受注を見込む
(00:45:44) MistralがForgeを発表し、企業が自社のAIモデルを構築するのを支援
(00:57:57) Metaは、性能面の懸念を受けて新しいA.I.モデルの展開を延期
政策 & 安全
(01:07:26) LLMモニタリングへの応用を伴うステガノグラフィーの意思決定論的形式化
(01:13:09) Reasoning Theater:チェーン・オブ・ソートからモデルの信念を切り離す
(01:18:29) 言語モデルにおける新たな不整合への訓練中の防御
(01:23:07) 最先端のAIエージェントは、多段階のサイバー攻撃シナリオでどのように振る舞うのか?
(01:25:20) Claude Opus 4.6のBrowseCompにおける評価(eval)意識
(01:29:49) Bloomを紹介:自動化された行動評価のためのオープンソース・ツール
(01:32:26) モデルは自らの憲法にどれくらい従うのか?
(01:37:11) NvidiaのH200ライセンスが、主要民主党議員の間で安全保障上の懸念を呼ぶ
研究 & 新展開
(01:40:050) [2603.15031] Attention Residuals
(01:47:11) Mamba-3:状態空間の原理を用いた改良された系列モデリング
