2026 · 05 · 02 · 土

5/2 のアップデート

今回は「調べるAI」から一歩進み、パソコン操作や複数アプリをまたぐ“実行”まで担う機能が一気に増えました。あわせて、文章・音声・医療など用途別の進化、企業導入の現実的な指標、そしてプライバシーや調達面のニュースも更新しています。

ここに表示するのは AI ニュースの寄せ集めではなく、カオスマップ／AI 大全に実際に書き加えられた変更点だけです。

A · Theme of the day

PC操作まで任せる“実行型AI”が増加

検索や相談だけでなく、手順を考えて実際に作業を進めるAIが主要サービスに広がりました。

Perplexityが自動実行

Perplexity

何が起きたか

Perplexity Computer自律エージェント（19モデル連携・400+アプリ統合、Maxプラン）

以前との違い

以前は「出典付きで調べる」ことが中心でした。今回、調べた結果をもとに手順を組み立てて作業まで進める機能が追加。多数のAIを使い分け、たくさんの外部サービスともつなげられる構成です。利用できるのは上位プラン向けです。

なぜ重要か

調査→整理→実行（登録、更新、投稿など）を一つの流れで任せやすくなります。人がやりがちな“調べた後のコピペ作業”を減らせる可能性があります。一方で、連携先が多いほど権限管理や誤操作の確認が重要になります。導入時は「どこまで自動でやらせるか」を決めるのが鍵です。

出典: perplexity.ai　·　→ カオスマップで見る

Perplexityの強み更新

Perplexity

何が起きたか

Perplexity Computer: 19モデルを並列オーケストレーションする自律エージェント、400+アプリ連携（Maxプラン）

以前との違い

これまでの強みは、リアルタイム検索と出典の分かりやすさでした。今回、複数のAIを並列に動かして作業を進める“自動実行”が強みに追加。さらに多数の外部アプリとつなげる前提の設計が明示されました。上位プランでの提供です。

なぜ重要か

「検索が得意」から「業務の一部を回す」へ、評価軸が変わります。プロダクト選定では精度だけでなく、連携先・権限・監査のしやすさが重要になります。チーム利用では、作業ログが残るか・誰が何を実行したかが管理ポイントです。同種の自動化ツールと比較する際の基準が増えました。

出典: perplexity.ai　·　→ カオスマップで見る

ClaudeがPC操作を代行

Claude

何が起きたか

Claude Cowork（PC操作自動化AIエージェント）が有料プランで一般提供開始。Zoomコネクタで会議データをCoworkへ取り込み可能

以前との違い

Claudeは長文の理解やコーディング支援が中心でした。今回、パソコン操作を自動化する機能が有料プランで広く使えるように。さらに会議の内容を取り込んで、作業に反映できる連携が追加されました。 “会議→タスク化→実行”をつなげやすい更新です。

なぜ重要か

議事録作成だけで終わらず、会議後の手配・更新作業まで短縮できます。人が忘れがちなフォローアップを、仕組みとして回しやすくなります。運用では、誤操作防止の確認ステップや、扱う情報の範囲を決めることが重要です。事務・営業・採用など、非エンジニア部門の自動化にも影響します。

出典: claude.ai　·　→ カオスマップで見る

Le Chatが自動タスク

Mistral

何が起きたか

Le Chatにエージェントモード追加（複数ステップのタスクを自律実行可能に）

以前との違い

Le Chatは主にチャットでの質問対応が中心でした。今回、複数ステップの作業をまとめて進める“エージェントモード”が追加。同社は業務フロー化の機能も進めており、その延長として位置づきます。チャットから実行へ踏み込んだ更新です。

なぜ重要か

単発の回答ではなく「手順を踏む仕事」に向くかどうかが選びやすくなります。見積作成、情報収集、社内手続きなど、繰り返し作業の自動化に近づきます。運用面では、失敗時の巻き戻しや、途中経過の確認が重要になります。価格と機能のバランスで、代替候補として検討しやすくなりました。

出典: mistral.ai　·　→ カオスマップで見る

GrokがPC自動化

Grok

何が起きたか

Grok Computer: 計画と実行を並列処理する自律デスクトップ自動化エージェント

以前との違い

GrokはSNS連携と長い文章の扱いが特徴でした。今回、計画と実行を同時並行で進める“デスクトップ自動化”が追加。単に提案するだけでなく、実際の操作まで担う方向へ拡張しています。自動化の色が強いアップデートです。

なぜ重要か

情報収集だけでなく、PC上の定型作業（入力、転記、整理）を減らせます。手順が長い作業ほど効果が出やすい一方、誤操作の影響も大きくなります。業務導入では、権限を絞った環境で試すなど安全設計が重要です。同種の“PC操作AI”が増える中での比較対象になります。

出典: grok.com　·　→ カオスマップで見る

Grokが創作を自動化

Grok

何が起きたか

Grok 4.3「Imagine」エージェントモード：創作・画像生成に特化した自律エージェント機能を追加

以前との違い

これまでも画像や動画の理解・生成が強みとして挙げられていました。今回、創作や画像づくりに特化した“エージェントモード”が追加。企画→素材作成→仕上げの流れを、まとめて進める想定の機能です。クリエイティブ用途を明確に押し出しました。

なぜ重要か

制作の初期案出しから試作までの時間を短縮しやすくなります。デザイン担当が少ない組織でも、たたき台の量産がしやすくなります。一方で、最終品質のチェックや著作権・ブランドの整合は人の役割が残ります。制作ツールの選定では“生成の質”だけでなく“制作手順の自動化”も評価軸になります。

出典: grok.com　·　→ カオスマップで見る

B · Theme of the day

仕事別に“専用AI”が見える化

法律レビューやセキュリティなど、職種・業務に直結する機能追加が進みました。

Wordに契約チェック

Microsoft Copilot

何が起きたか

Microsoft Word内にAI Legal Agent（契約書レビュー・条項チェック・修正案提示）を統合

以前との違い

従来はOffice全体にAIが統合され、文章作成や要約が主用途でした。今回、Wordの中で契約書を点検する専用のAI機能が統合。条文の確認や修正案の提示までを、文書作業の流れで行える形です。 “別ツールに貼る”前提から一歩進みました。

なぜ重要か

契約レビューの初期チェックを速くし、抜け漏れを減らす助けになります。法務が忙しい組織では、相談前の下準備として効果が出やすいです。ただし最終判断は人が行う必要があり、根拠の確認フローが重要です。プロダクト選定では、文書管理・権限・履歴が社内ルールに合うかが焦点になります。

出典: copilot.microsoft.com　·　→ カオスマップで見る

Claudeが防御に特化

Claude（Anthropic）

何が起きたか

Claude Security（企業向けAIセキュリティツール）を提供開始（Mythosモデルの技術を活用し防御側のAI優位を支援）

以前との違い

Claudeは文章理解やコーディング支援が強みとして語られがちでした。今回、企業向けのセキュリティ用途に特化した提供が開始。攻撃を“見つけて防ぐ側”を支援する位置づけが明確になりました。汎用チャットから、用途別の製品へ広がっています。

なぜ重要か

社内の安全対策を“人手だけ”に頼りにくい状況で、補助戦力になりえます。運用では、検知結果の優先度付けや、対応手順の標準化が進めやすくなります。導入判断は、既存の監視・チケット管理とつながるかが重要になります。「何でもできるAI」ではなく「守りを強くするAI」として比較しやすくなりました。

出典: anthropic.com　·　→ カオスマップで見る

C · Theme of the day

音声・医療など“体験品質”の進化

読み上げの自然さや専門領域の性能など、ユーザー体験に直結する進歩が目立ちました。

Geminiの感情音声

Gemini

何が起きたか

Gemini 3.1 Flash TTS Preview：感情・テンポ・スタイルを動的に制御する高表現力音声合成（Audio tags機能、低遅延ストリーミング対応）

以前との違い

これまでの更新は検索や業務ツール連携、長い文脈の扱いが中心でした。今回、感情や話す速さ、話し方の雰囲気を細かく変えられる音声機能が追加。さらに遅れを抑えたストリーミングにも対応し、会話用途を意識しています。 “読む”だけでなく“話す”体験が強化されました。

なぜ重要か

コールセンター、案内音声、学習アプリなどで“機械っぽさ”を減らせます。声のトーンを場面で変えられるため、ブランド体験を作り込みやすくなります。リアルタイム性が上がるほど、誤案内時の影響も大きいので監視が重要です。音声を使うプロダクトでは、生成品質が差別化要因になりやすくなります。

出典: gemini.google.com　·　→ カオスマップで見る

医療診断で新結果

Gemini（Google）

何が起きたか

DeepMindのAIコ・クリニシャンが盲検医師テストでGPT-5.4を上回る医療診断能力を実証

以前との違い

Gemini/DeepMindは推論力やエコシステム統合が注目されてきました。今回、医療の診断支援で、医師の目隠し評価における性能結果が追加。競合モデルより良い成績を示したという報告で、専門領域の強さが目立ちます。研究発表ベースの更新です。

なぜ重要か

医療向けは“便利”以上に、精度と説明責任が重要な領域です。病院・保険・ヘルスケア企業は、実証結果をもとに検証を進めやすくなります。ただし実運用には規制・責任分界・監査が不可欠で、導入は段階的になります。一般企業でも、健康相談や福利厚生サービスの品質向上に波及する可能性があります。

出典: deepmind.google　·　→ カオスマップで見る

D · Theme of the day

導入コスト・協業・品質安定の更新

実際の利用規模、チームでの使い方、ローカル運用時の安定性など“現場の論点”が追加されました。

Uberの採用が加速

Claude Code

何が起きたか

Uberが全エンジニアの約95%でClaude Codeを採用・コミットの約70%がAI生成に（2026年4月実績）

以前との違い

Claude Codeは開発フローに入り込める点が評価されていました。今回、大規模企業での採用率と成果の目安が具体的に追記。ほとんどのエンジニアが使い、コード変更の多くがAI由来という実績です。利用が一気に広がった事例として位置づきます。

なぜ重要か

導入検討で最大の不安である「本当に現場が使うか」に具体例が出ました。費用が想定より膨らむ可能性も示しており、予算設計の参考になります。成功には運用ルール（レビュー、テスト、権限）をセットで整える必要があります。ツール選定では“機能”だけでなく“組織に根付く導線”が重要だと分かります。

出典: docs.anthropic.com　·　→ カオスマップで見る

Poeで大人数協業

Poe

何が起きたか

最大200人 × 200+モデルのグループチャット協業機能

以前との違い

Poeは複数のAIを切り替えて使える点が特徴でした。今回、最大200人規模で、たくさんのモデルを同じ場で使う協業機能が追加。個人利用中心から、チームの会話・意思決定の場へ広げる更新です。会議室のような使い方が想定されます。

なぜ重要か

部署横断で同じ議題を検討し、役割別にAIを使い分けやすくなります。 “誰がどのAIに何を聞いたか”が共有されると、やり直しの手間が減ります。一方で、情報の持ち込み範囲や公開範囲のルール作りが必須になります。比較では、履歴管理やアクセス制御がどこまでできるかが重要です。

出典: poe.com　·　→ カオスマップで見る

長文処理の不具合修正

Mistral

何が起きたか

Mistral Medium 3.5 GGUFの初期バグ（YaRNパース問題）をUnslothが修正・配布済み（ロングコンテキスト性能が回復）

以前との違い

Mistral Medium 3.5は公開モデルとして注目されていました。今回、特定形式で配布された版にあった不具合が修正され、配布も進みました。影響していたのは長い文章を扱う際の性能で、回復したとされています。 “使い始めのつまずき”が減る更新です。

なぜ重要か

ローカル環境や自社環境で動かす場合、安定性は導入可否に直結します。長い資料やログを扱う業務では、性能低下があると使い物になりません。修正済みが明確だと、検証や再現テストのコストを下げられます。選定時は、モデル性能だけでなく配布物の品質管理も見る必要があります。

出典: mistral.ai　·　→ カオスマップで見る

Grokの新プラン追加

Grok

何が起きたか

SuperGrok Lite: $10/月 (2026/3/25〜)

以前との違い

これまでも複数の有料層があり、上位ほど機能が強い構成でした。今回、月10ドルの軽量プランが追加され、入口の選択肢が増えました。 SNS利用者が試しやすい価格帯を用意した形です。価格ラインナップの更新です。

なぜ重要か

チーム導入前に、小さく試すための費用ハードルが下がります。個人が試して良かったものを職場に持ち込む流れ（ボトムアップ）が起きやすくなります。一方で、プラン差で使える機能が変わるため、必要条件の整理が重要です。選定では“最安で何ができるか”を基準に比較しやすくなりました。

出典: grok.com　·　→ カオスマップで見る

Claude Code事例を追記

Claude Code 入門：ターミナルから使うAIコーディングアシスタント

何が起きたか

大規模な事例として、Uberが2025年12月にClaude Codeを全エンジニアへ導入した結果、2026年4月時点で全エンジニアの約95%が月次でAIコーディングツールを活用し、コミットの約70%がAI生成になっています。1人あたりのAIコーディング費用は月500〜2,000ドル規模まで拡大し、2026年分の年間予算を4ヶ月で使い切るほどの普及速度でした（導入失敗ではなく、想定以上の高速普及による）。

以前との違い

入門記事では、端末から使う開発支援としての特徴を説明していました。今回、Uberの大規模導入の結果が、具体的な数値とともに記事に追記。普及の速さや費用規模まで踏み込んだ内容になっています。読み物から“導入判断の材料”へ情報が増えました。

なぜ重要か

社内稟議で必要になりがちな「他社の実績」「費用感」の裏付けになります。導入後に利用が急増する可能性があるため、上限設定や運用ルールの検討が進みます。開発生産性だけでなく、レビュー体制や品質管理の設計にも目が向きます。記事が“学ぶ”だけでなく“意思決定する”ための資料に近づきました。

出典: localhost　·　→ AI 大全で見る

E · Theme of the day

プライバシーと調達のニュース

無料枠のデータ扱いと、国の大型調達に関する動きが、選定時の前提条件に影響します。

無料版の追跡設定変更

ChatGPT

何が起きたか

広告配信国の無料ユーザー向けマーケティングCookieをデフォルト有効化（有料プランは対象外・設定でオプトアウト可）

以前との違い

無料版の広告表示はすでに始まっていました。今回、広告対象の国の無料ユーザーで、マーケティング目的の追跡が初期状態で有効に。有料プランは対象外で、設定から無効化は可能とされています。 “無料で使う”際の前提が変わりました。

なぜ重要か

個人でも企業でも、無料枠の利用は情報管理のルールと衝突しやすくなります。社内で試用する場合、アカウント種別や設定の統一が必要になります。プロダクト選定では、価格だけでなくデータの扱いが意思決定に直結します。利用者への説明（何が収集されうるか）を用意しておくとトラブルを減らせます。

出典: chat.openai.com　·　→ カオスマップで見る

OpenAIが国の案件参加

GPT（OpenAI）

何が起きたか

米国防総省の機密AIプログラムに参加（Google・Nvidia・xAIとともに選定）

以前との違い

モデルの種類や提供先の拡大が続いていました。今回、米国防総省の機密AIプログラムに選ばれたことが追記。複数の大手と並んで参加する形で、信頼性や体制面の評価を示すニュースです。公共分野での存在感が増しています。

なぜ重要か

大規模な顧客が求める要件（運用体制、信頼性）に耐える方向へ進みやすくなります。企業選定では、長期供給やサポート体制を重視する層にとって安心材料になります。一方で、公共案件の影響で提供方針が変わる可能性もあり、継続監視が必要です。 “技術力”だけでなく“調達で選ばれる力”が比較軸として見えます。

出典: openai.com　·　→ カオスマップで見る

Anthropicは国案件除外

Claude（Anthropic）

何が起きたか

米国防総省の機密AIプログラムから除外（サプライチェーンリスクを理由として、OpenAI・Google・Nvidia・xAIは参加）

以前との違い

Claudeは高性能さで評価される一方、弱点として外部連携の小ささなどが挙げられていました。今回、米国防総省の機密AIプログラムから外れたことが追記。理由は供給網のリスクとされています。競合が参加する中での対照的なニュースです。

なぜ重要か

特定の業界（政府・防衛・重要インフラ）では、調達要件に影響し得ます。民間企業でも、サプライチェーンや提供体制を気にする場合は判断材料になります。ただし機能や品質の優劣と直結しない面もあるため、用途別に切り分けが必要です。選定では、技術だけでなく“継続供給の確からしさ”を評価する流れが強まります。

出典: anthropic.com　·　→ カオスマップで見る

過去のアップデート

サイトに反映された変更を日次でアーカイブしています。