2026 · 05 · 02 · 土

5/2 のアップデート

今回は「調べるAI」から一歩進み、パソコン操作や複数アプリをまたぐ“実行”まで担う機能が一気に増えました。あわせて、文章・音声・医療など用途別の進化、企業導入の現実的な指標、そしてプライバシーや調達面のニュースも更新しています。

ここに表示するのは AI ニュースの寄せ集めではなく、カオスマップ/AI 大全に実際に書き加えられた変更点だけです。

A · Theme of the day

PC操作まで任せる“実行型AI”が増加

検索や相談だけでなく、手順を考えて実際に作業を進めるAIが主要サービスに広がりました。

Perplexityが自動実行

PerplexityPerplexity
何が起きたか

Perplexity Computer自律エージェント(19モデル連携・400+アプリ統合、Maxプラン)

以前との違い

以前は「出典付きで調べる」ことが中心でした。 今回、調べた結果をもとに手順を組み立てて作業まで進める機能が追加。 多数のAIを使い分け、たくさんの外部サービスともつなげられる構成です。 利用できるのは上位プラン向けです。

なぜ重要か

調査→整理→実行(登録、更新、投稿など)を一つの流れで任せやすくなります。 人がやりがちな“調べた後のコピペ作業”を減らせる可能性があります。 一方で、連携先が多いほど権限管理や誤操作の確認が重要になります。 導入時は「どこまで自動でやらせるか」を決めるのが鍵です。

Perplexityの強み更新

PerplexityPerplexity
何が起きたか

Perplexity Computer: 19モデルを並列オーケストレーションする自律エージェント、400+アプリ連携(Maxプラン)

以前との違い

これまでの強みは、リアルタイム検索と出典の分かりやすさでした。 今回、複数のAIを並列に動かして作業を進める“自動実行”が強みに追加。 さらに多数の外部アプリとつなげる前提の設計が明示されました。 上位プランでの提供です。

なぜ重要か

「検索が得意」から「業務の一部を回す」へ、評価軸が変わります。 プロダクト選定では精度だけでなく、連携先・権限・監査のしやすさが重要になります。 チーム利用では、作業ログが残るか・誰が何を実行したかが管理ポイントです。 同種の自動化ツールと比較する際の基準が増えました。

ClaudeがPC操作を代行

ClaudeClaude
何が起きたか

Claude Cowork(PC操作自動化AIエージェント)が有料プランで一般提供開始。Zoomコネクタで会議データをCoworkへ取り込み可能

以前との違い

Claudeは長文の理解やコーディング支援が中心でした。 今回、パソコン操作を自動化する機能が有料プランで広く使えるように。 さらに会議の内容を取り込んで、作業に反映できる連携が追加されました。 “会議→タスク化→実行”をつなげやすい更新です。

なぜ重要か

議事録作成だけで終わらず、会議後の手配・更新作業まで短縮できます。 人が忘れがちなフォローアップを、仕組みとして回しやすくなります。 運用では、誤操作防止の確認ステップや、扱う情報の範囲を決めることが重要です。 事務・営業・採用など、非エンジニア部門の自動化にも影響します。

Le Chatが自動タスク

MistralMistral
何が起きたか

Le Chatにエージェントモード追加(複数ステップのタスクを自律実行可能に)

以前との違い

Le Chatは主にチャットでの質問対応が中心でした。 今回、複数ステップの作業をまとめて進める“エージェントモード”が追加。 同社は業務フロー化の機能も進めており、その延長として位置づきます。 チャットから実行へ踏み込んだ更新です。

なぜ重要か

単発の回答ではなく「手順を踏む仕事」に向くかどうかが選びやすくなります。 見積作成、情報収集、社内手続きなど、繰り返し作業の自動化に近づきます。 運用面では、失敗時の巻き戻しや、途中経過の確認が重要になります。 価格と機能のバランスで、代替候補として検討しやすくなりました。

GrokがPC自動化

GrokGrok
何が起きたか

Grok Computer: 計画と実行を並列処理する自律デスクトップ自動化エージェント

以前との違い

GrokはSNS連携と長い文章の扱いが特徴でした。 今回、計画と実行を同時並行で進める“デスクトップ自動化”が追加。 単に提案するだけでなく、実際の操作まで担う方向へ拡張しています。 自動化の色が強いアップデートです。

なぜ重要か

情報収集だけでなく、PC上の定型作業(入力、転記、整理)を減らせます。 手順が長い作業ほど効果が出やすい一方、誤操作の影響も大きくなります。 業務導入では、権限を絞った環境で試すなど安全設計が重要です。 同種の“PC操作AI”が増える中での比較対象になります。

Grokが創作を自動化

GrokGrok
何が起きたか

Grok 4.3「Imagine」エージェントモード:創作・画像生成に特化した自律エージェント機能を追加

以前との違い

これまでも画像や動画の理解・生成が強みとして挙げられていました。 今回、創作や画像づくりに特化した“エージェントモード”が追加。 企画→素材作成→仕上げの流れを、まとめて進める想定の機能です。 クリエイティブ用途を明確に押し出しました。

なぜ重要か

制作の初期案出しから試作までの時間を短縮しやすくなります。 デザイン担当が少ない組織でも、たたき台の量産がしやすくなります。 一方で、最終品質のチェックや著作権・ブランドの整合は人の役割が残ります。 制作ツールの選定では“生成の質”だけでなく“制作手順の自動化”も評価軸になります。

B · Theme of the day

仕事別に“専用AI”が見える化

法律レビューやセキュリティなど、職種・業務に直結する機能追加が進みました。

Wordに契約チェック

Microsoft CopilotMicrosoft Copilot
何が起きたか

Microsoft Word内にAI Legal Agent(契約書レビュー・条項チェック・修正案提示)を統合

以前との違い

従来はOffice全体にAIが統合され、文章作成や要約が主用途でした。 今回、Wordの中で契約書を点検する専用のAI機能が統合。 条文の確認や修正案の提示までを、文書作業の流れで行える形です。 “別ツールに貼る”前提から一歩進みました。

なぜ重要か

契約レビューの初期チェックを速くし、抜け漏れを減らす助けになります。 法務が忙しい組織では、相談前の下準備として効果が出やすいです。 ただし最終判断は人が行う必要があり、根拠の確認フローが重要です。 プロダクト選定では、文書管理・権限・履歴が社内ルールに合うかが焦点になります。

Claudeが防御に特化

Claude(Anthropic)Claude(Anthropic)
何が起きたか

Claude Security(企業向けAIセキュリティツール)を提供開始(Mythosモデルの技術を活用し防御側のAI優位を支援)

以前との違い

Claudeは文章理解やコーディング支援が強みとして語られがちでした。 今回、企業向けのセキュリティ用途に特化した提供が開始。 攻撃を“見つけて防ぐ側”を支援する位置づけが明確になりました。 汎用チャットから、用途別の製品へ広がっています。

なぜ重要か

社内の安全対策を“人手だけ”に頼りにくい状況で、補助戦力になりえます。 運用では、検知結果の優先度付けや、対応手順の標準化が進めやすくなります。 導入判断は、既存の監視・チケット管理とつながるかが重要になります。 「何でもできるAI」ではなく「守りを強くするAI」として比較しやすくなりました。

C · Theme of the day

音声・医療など“体験品質”の進化

読み上げの自然さや専門領域の性能など、ユーザー体験に直結する進歩が目立ちました。

Geminiの感情音声

GeminiGemini
何が起きたか

Gemini 3.1 Flash TTS Preview:感情・テンポ・スタイルを動的に制御する高表現力音声合成(Audio tags機能、低遅延ストリーミング対応)

以前との違い

これまでの更新は検索や業務ツール連携、長い文脈の扱いが中心でした。 今回、感情や話す速さ、話し方の雰囲気を細かく変えられる音声機能が追加。 さらに遅れを抑えたストリーミングにも対応し、会話用途を意識しています。 “読む”だけでなく“話す”体験が強化されました。

なぜ重要か

コールセンター、案内音声、学習アプリなどで“機械っぽさ”を減らせます。 声のトーンを場面で変えられるため、ブランド体験を作り込みやすくなります。 リアルタイム性が上がるほど、誤案内時の影響も大きいので監視が重要です。 音声を使うプロダクトでは、生成品質が差別化要因になりやすくなります。

医療診断で新結果

Gemini(Google)Gemini(Google)
何が起きたか

DeepMindのAIコ・クリニシャンが盲検医師テストでGPT-5.4を上回る医療診断能力を実証

以前との違い

Gemini/DeepMindは推論力やエコシステム統合が注目されてきました。 今回、医療の診断支援で、医師の目隠し評価における性能結果が追加。 競合モデルより良い成績を示したという報告で、専門領域の強さが目立ちます。 研究発表ベースの更新です。

なぜ重要か

医療向けは“便利”以上に、精度と説明責任が重要な領域です。 病院・保険・ヘルスケア企業は、実証結果をもとに検証を進めやすくなります。 ただし実運用には規制・責任分界・監査が不可欠で、導入は段階的になります。 一般企業でも、健康相談や福利厚生サービスの品質向上に波及する可能性があります。

D · Theme of the day

導入コスト・協業・品質安定の更新

実際の利用規模、チームでの使い方、ローカル運用時の安定性など“現場の論点”が追加されました。

Uberの採用が加速

Claude CodeClaude Code
何が起きたか

Uberが全エンジニアの約95%でClaude Codeを採用・コミットの約70%がAI生成に(2026年4月実績)

以前との違い

Claude Codeは開発フローに入り込める点が評価されていました。 今回、大規模企業での採用率と成果の目安が具体的に追記。 ほとんどのエンジニアが使い、コード変更の多くがAI由来という実績です。 利用が一気に広がった事例として位置づきます。

なぜ重要か

導入検討で最大の不安である「本当に現場が使うか」に具体例が出ました。 費用が想定より膨らむ可能性も示しており、予算設計の参考になります。 成功には運用ルール(レビュー、テスト、権限)をセットで整える必要があります。 ツール選定では“機能”だけでなく“組織に根付く導線”が重要だと分かります。

Poeで大人数協業

PoePoe
何が起きたか

最大200人 × 200+モデルのグループチャット協業機能

以前との違い

Poeは複数のAIを切り替えて使える点が特徴でした。 今回、最大200人規模で、たくさんのモデルを同じ場で使う協業機能が追加。 個人利用中心から、チームの会話・意思決定の場へ広げる更新です。 会議室のような使い方が想定されます。

なぜ重要か

部署横断で同じ議題を検討し、役割別にAIを使い分けやすくなります。 “誰がどのAIに何を聞いたか”が共有されると、やり直しの手間が減ります。 一方で、情報の持ち込み範囲や公開範囲のルール作りが必須になります。 比較では、履歴管理やアクセス制御がどこまでできるかが重要です。

長文処理の不具合修正

MistralMistral
何が起きたか

Mistral Medium 3.5 GGUFの初期バグ(YaRNパース問題)をUnslothが修正・配布済み(ロングコンテキスト性能が回復)

以前との違い

Mistral Medium 3.5は公開モデルとして注目されていました。 今回、特定形式で配布された版にあった不具合が修正され、配布も進みました。 影響していたのは長い文章を扱う際の性能で、回復したとされています。 “使い始めのつまずき”が減る更新です。

なぜ重要か

ローカル環境や自社環境で動かす場合、安定性は導入可否に直結します。 長い資料やログを扱う業務では、性能低下があると使い物になりません。 修正済みが明確だと、検証や再現テストのコストを下げられます。 選定時は、モデル性能だけでなく配布物の品質管理も見る必要があります。

Grokの新プラン追加

GrokGrok
何が起きたか

SuperGrok Lite: $10/月 (2026/3/25〜)

以前との違い

これまでも複数の有料層があり、上位ほど機能が強い構成でした。 今回、月10ドルの軽量プランが追加され、入口の選択肢が増えました。 SNS利用者が試しやすい価格帯を用意した形です。 価格ラインナップの更新です。

なぜ重要か

チーム導入前に、小さく試すための費用ハードルが下がります。 個人が試して良かったものを職場に持ち込む流れ(ボトムアップ)が起きやすくなります。 一方で、プラン差で使える機能が変わるため、必要条件の整理が重要です。 選定では“最安で何ができるか”を基準に比較しやすくなりました。

Claude Code事例を追記

Claude Code 入門:ターミナルから使うAIコーディングアシスタント
何が起きたか

大規模な事例として、Uberが2025年12月にClaude Codeを全エンジニアへ導入した結果、2026年4月時点で全エンジニアの約95%が月次でAIコーディングツールを活用し、コミットの約70%がAI生成になっています。1人あたりのAIコーディング費用は月500〜2,000ドル規模まで拡大し、2026年分の年間予算を4ヶ月で使い切るほどの普及速度でした(導入失敗ではなく、想定以上の高速普及による)。

以前との違い

入門記事では、端末から使う開発支援としての特徴を説明していました。 今回、Uberの大規模導入の結果が、具体的な数値とともに記事に追記。 普及の速さや費用規模まで踏み込んだ内容になっています。 読み物から“導入判断の材料”へ情報が増えました。

なぜ重要か

社内稟議で必要になりがちな「他社の実績」「費用感」の裏付けになります。 導入後に利用が急増する可能性があるため、上限設定や運用ルールの検討が進みます。 開発生産性だけでなく、レビュー体制や品質管理の設計にも目が向きます。 記事が“学ぶ”だけでなく“意思決定する”ための資料に近づきました。

E · Theme of the day

プライバシーと調達のニュース

無料枠のデータ扱いと、国の大型調達に関する動きが、選定時の前提条件に影響します。

無料版の追跡設定変更

ChatGPTChatGPT
何が起きたか

広告配信国の無料ユーザー向けマーケティングCookieをデフォルト有効化(有料プランは対象外・設定でオプトアウト可)

以前との違い

無料版の広告表示はすでに始まっていました。 今回、広告対象の国の無料ユーザーで、マーケティング目的の追跡が初期状態で有効に。 有料プランは対象外で、設定から無効化は可能とされています。 “無料で使う”際の前提が変わりました。

なぜ重要か

個人でも企業でも、無料枠の利用は情報管理のルールと衝突しやすくなります。 社内で試用する場合、アカウント種別や設定の統一が必要になります。 プロダクト選定では、価格だけでなくデータの扱いが意思決定に直結します。 利用者への説明(何が収集されうるか)を用意しておくとトラブルを減らせます。

OpenAIが国の案件参加

GPT(OpenAI)GPT(OpenAI)
何が起きたか

米国防総省の機密AIプログラムに参加(Google・Nvidia・xAIとともに選定)

以前との違い

モデルの種類や提供先の拡大が続いていました。 今回、米国防総省の機密AIプログラムに選ばれたことが追記。 複数の大手と並んで参加する形で、信頼性や体制面の評価を示すニュースです。 公共分野での存在感が増しています。

なぜ重要か

大規模な顧客が求める要件(運用体制、信頼性)に耐える方向へ進みやすくなります。 企業選定では、長期供給やサポート体制を重視する層にとって安心材料になります。 一方で、公共案件の影響で提供方針が変わる可能性もあり、継続監視が必要です。 “技術力”だけでなく“調達で選ばれる力”が比較軸として見えます。

Anthropicは国案件除外

Claude(Anthropic)Claude(Anthropic)
何が起きたか

米国防総省の機密AIプログラムから除外(サプライチェーンリスクを理由として、OpenAI・Google・Nvidia・xAIは参加)

以前との違い

Claudeは高性能さで評価される一方、弱点として外部連携の小ささなどが挙げられていました。 今回、米国防総省の機密AIプログラムから外れたことが追記。 理由は供給網のリスクとされています。 競合が参加する中での対照的なニュースです。

なぜ重要か

特定の業界(政府・防衛・重要インフラ)では、調達要件に影響し得ます。 民間企業でも、サプライチェーンや提供体制を気にする場合は判断材料になります。 ただし機能や品質の優劣と直結しない面もあるため、用途別に切り分けが必要です。 選定では、技術だけでなく“継続供給の確からしさ”を評価する流れが強まります。

Archive

過去のアップデート

サイトに反映された変更を日次でアーカイブしています。