アップデート | AI Navigate

A · Theme of the day

Anthropicが一段ギアを入れた日

ARR 300億ドル到達・金融エージェント・Dreaming・HackerOne・Firefox 271件と、今日だけでAnthropicが5本まとめて動きました。

Claudeの売上、1年で3倍超の300億ドルへ

Claude（Anthropic）

何が起きたか

年換算売上（ARR）が300億ドルに到達（2025年末の90億ドルから急拡大、エンタープライズ需要が主因・CEO発表）

以前との違い

2025年末時点のARRは90億ドルでした。当時でも成長中でしたがOpenAIとの差は大きいという見方が多かったです。ここ数ヶ月でエンタープライズ契約が積み重なり、CEO自らが300億ドル到達を発表しました。

なぜ重要か

モデル選定でClaudeを候補に入れるか迷っているチームには実績値として使えます。Claudeをすでに使っている人には直接の変化はなし。ただ会社としての継続性への信頼は上がります。

出典: anthropic.com　·　→ カオスマップで見る

金融・保険の実務に刺さるClaudeエージェントが来た

Claude（Anthropic）

何が起きたか

金融・保険業界向けClaudeエージェントを発表（資料作成・監査準備・AML調査などを業務フローに沿って支援）

以前との違い

半年前からClaudeを金融業務に使いたいという声はありましたが、汎用APIを業務フローに落とし込む部分は自前で作る必要がありました。PoCはできたが本番導入が重かったという声が多かったです。

なぜ重要か

金融・保険の情シスやDX推進チームには稟議に書きやすい名目が増えます。APIをカスタマイズするのではなく業務フロー対応済みのエージェントとして使えるので、導入の起点が下がります。非金融業の人には今日は関係薄めです。

出典: anthropic.com　·　→ カオスマップで見る

Claudeエージェントが夜中に自分で記憶を整理する

Claude（Anthropic）

何が起きたか

Claude Managed Agentsに「Dreaming」機能追加（過去セッションの非同期振り返り・メモリ整理・古いメモリ項目の整合）、OutcomesとMultiagent Orchestrationもパブリックベータに

以前との違い

これまでのManaged Agentsはセッションをまたぐと記憶の一貫性が弱く、古い情報が残ったまま新しいタスクに混入するケースがありました。長期運用するほどメモリのノイズが溜まっていく問題がありました。

なぜ重要か

エージェントを業務で長期運用している開発者にはメモリのメンテコストが下がります。OutcomesとMultiagent Orchestrationもベータに出たので、マルチエージェント構成を試しているチームは今が実験のタイミングです。週数回しかAPIを触らない人には誤差です。

出典: anthropic.com　·　→ カオスマップで見る

ClaudeのAI脆弱性、外部から直接報告できるようになった

Claude（Anthropic）

何が起きたか

HackerOne上でセキュリティバグバウンティプログラムを一般公開（外部ハッカーがClaudeのAIセキュリティ脆弱性を直接報告可能に）

以前との違い

これまでAnthropicのセキュリティ報告は内部チームとのクローズドな連携が中心で、外部研究者がAI固有の脆弱性（プロンプトインジェクションなど）を見つけても報告ルートが不明確でした。

なぜ重要か

セキュリティ研究者にはAnthropicへの正式報告窓口ができます。外部の目を入れる姿勢を示すことでClaude導入時のリスク評価が楽になります。Claude APIを使っているエンジニアにはエコシステムの信頼性が上がる間接的なプラスがあります。

出典: anthropic.com　·　→ カオスマップで見る

ClaudeがFirefoxの271件の未知バグを掘り当てた

Claude（Anthropic）

何が起きたか

Claude Mythosプレビュー版がMozillaのエージェント型パイプラインでFirefox 150の未公開脆弱性271件を発見（20年前の古いバグも含む、新コミット前の自動セキュリティ確認に採用）

以前との違い

AIが脆弱性を発見する実験は各社が進めていましたが、実際のプロダクションコードで未公開の脆弱性を271件という規模で報告した前例はほぼありませんでした。人間のレッドチームや静的解析ツールが中心でした。

なぜ重要か

大規模コードベースを持つチームにはコミット前のセキュリティレビューにAIを組み込む前例ができました。エンジニア以外の人には今日は関係薄いですが、AI主導のセキュリティが現実路線に入ってきたという意味では業界全体への一手です。

出典: anthropic.com　·　→ カオスマップで見る

B · Theme of the day

vibe-codingアプリが穴だらけだった

Lovable・Replitなどで作られた公開アプリのうち約5,000件に企業機密データが露出していたという調査が出ました。

Lovable製アプリ、医療・金融データが丸見えのケースも

Lovable

何が起きたか

セキュリティリスク: vibe-codingで生成・公開されたアプリのうち約5,000件に企業機密データが露出と判明（RedAccess調査・Axios/Wiredが独自検証、HIPAAやGDPR規制にも抵触し得る情報を含む）

以前との違い

Lovableは非エンジニアでもアプリを公開できるのがウリで半年前から急速に普及しました。自動生成コードのセキュリティ設定が甘い場合に誰でもデータにアクセスできてしまうリスクは以前から指摘されていましたが、実態調査はされていませんでした。

なぜ重要か

Lovableで社内ツールや顧客向けアプリを作っていたなら今日中に公開中アプリのデータアクセス設定を確認したほうがいいです。特にSupabaseやFirebaseと連携している場合は認証フローを必ず見直してください。個人の趣味アプリで機密データを扱っていない人には今日は誤差です。

出典: lovable.dev　·　→ カオスマップで見る

Replitも同じ穴、5,000件問題はvibe-coding全体の話

Replit

何が起きたか

セキュリティリスク: vibe-codingで生成・公開されたアプリのうち約5,000件に企業機密データが露出と判明（RedAccess調査・Axios/Wiredが独自検証、医療・金融データを含む案件も）

以前との違い

LovableとReplitはvibe-codingの代表格として並んで名前が挙がることが多かったです。今回の調査はLovableだけでなくBase44を含む複数プラットフォームが対象で、Replitでも同様の問題が確認されています。

なぜ重要か

Replitで業務用・社内用アプリを動かしているなら、アクセス制御の設定を改めて確認することを勧めます。無料・低額プランで認証なしで公開しているケースが多く、そこにデータが絡むと漏洩リスクになります。個人の学習用や認証不要の公開ツールなら今日は関係ありません。

出典: replit.com　·　→ カオスマップで見る

C · Theme of the day

音声APIとモデルが選び放題になる

ChatGPTのリアルタイム音声API 3種が出て、Mistral Medium 3.5のセルフホスト仕様も固まりました。

リアルタイム翻訳・文字起こしAPIが3本同時に出た

ChatGPT

何が起きたか

リアルタイム音声モデル3種をAPIリリース：GPT-Realtime-2（GPT-5相当の推論）・GPT-Realtime-Translate（70言語リアルタイム翻訳）・GPT-Realtime-Whisper（低遅延文字起こし）

以前との違い

昨年末のRealtime APIは単一モデルで用途別の使い分けができませんでした。通訳・文字起こし・会話AIをそれぞれ別サービスで組み合わせていたチームが多く、レイテンシも用途によってオーバースペックだったり不足だったりしていました。

なぜ重要か

会議通訳アプリや音声インターフェースを作っているエンジニアには選択肢が明確になります。翻訳ならTranslate・議事録ならWhisper・会話AIならRealtime-2と切り分けられ、コスト設計も楽になります。70言語対応はグローバル向けプロダクトに即使えます。音声機能を使っていない人には今日は関係なし。

出典: chat.openai.com　·　→ カオスマップで見る

Mistral Medium 3.5、4台のGPUでセルフホストできる

Mistral

何が起きたか

Mistral Medium 3.5の詳細スペック：128Bブレンドモデル・256kコンテキスト・SWE-Bench Verified 77.6%達成・最小4GPU構成のセルフホスト可能・修正MITライセンスで商用利用可

以前との違い

先週オープンウェイトで公開されたMistral Medium 3.5ですが、自前GPUで動かすのに何台必要かが不明でセルフホストの現実性を判断できない人が多かったです。ベンチマーク値も出ていませんでした。

なぜ重要か

GPU 4台は個人には重いですが自前サーバーを持つ企業なら試せる規模です。SWE-Bench 77.6%はClaude Sonnet 4.5超えの水準で、APIコストゼロでその性能が出ます。商用可ライセンスなのでプロダクト組み込みも現実的になりました。クラウドAPIで十分な人には誤差です。

出典: mistral.ai　·　→ カオスマップで見る

AI学習基盤のネットワーク規格をOpenAIが公開

GPT（OpenAI）

何が起きたか

大規模AIスーパーコンピュータ向けオープンネットワークプロトコル「MRC（Multipath Reliable Connection）」を公開（AMD・Intel・MS・NVIDIA等と共同開発）

以前との違い

大規模AI学習クラスターのネットワーク接続は各社が独自実装を使っていました。InfiniBandが主流でしたがスケール時にボトルネックになるケースがあり、マルチベンダー環境での標準がありませんでした。

なぜ重要か

直接影響するのは大規模モデルの学習インフラを構築・運用しているエンジニアです。標準化が進めば将来的にAI学習コストが下がる方向に動くため、間接的にはAPIコストや提供モデルの性能に影響します。今日の段階で個人開発や日常業務に直接触れる話ではありません。

出典: openai.com　·　→ カオスマップで見る

D · Theme of the day

PCが自分のAI司令塔になり始める

PerplexityのMac版個人エージェントが一般公開され、Adobe AcrobatもAIで丸ごとリニューアルされています。

PerplexityのMacアプリが全員に開放

Perplexity

何が起きたか

「Personal Computer」デスクトップアプリをMac全ユーザーに一般提供開始（ローカルファイル・アプリ・Web横断の個人ワークフロー自動化）

以前との違い

先月まで招待制で一部のベータユーザーしか使えませんでした。ローカルファイルとWebを横断して検索・操作できる点は話題になっていましたが、使いたいけど順番待ちという状態でした。

なぜ重要か

検索とローカルファイルを一緒に扱いたい人には今日から試せます。Finderを開かずにファイルを探しながらWebも引けるのは調査系の作業を毎日する人には時短になります。WindowsユーザーはまだWindowsリリース待ちで今日は関係ありません。

出典: perplexity.ai　·　→ カオスマップで見る

AcrobatがPDFを読んで答える窓口になった

Adobe Firefly

何が起きたか

Acrobatに「PDF Spaces」と生産性エージェントを発表（ドキュメントAI統合でPDF読解・要約・編集を一元化）

以前との違い

AcrobatにはChatPDF的なAI読解機能が昨年から入っていましたが、要約・編集・検索が別々のUIに散らばっていてシームレスに使えないという声がありました。AIエージェントとして一体的に動く体験ではなかったです。

なぜ重要か

PDFを日常的に読む人（契約書・レポート・論文など）には読む時間が体感で短くなります。Acrobatを既に使っていればすぐ触れます。外部ツールでPDF要約していた人には乗り換えの判断材料が増えます。PDFをほとんど触らない人には誤差です。

出典: firefly.adobe.com　·　→ カオスマップで見る

Manusが「つなぎ方がわからない」を自動で解決する

Manus

何が起きたか

AIエージェントが不足コネクタを自動検出してユーザーへ提案する新機能を公開（導入・運用の手間を削減）

以前との違い

Manusは自律型エージェントとして話題でしたが、外部サービスとの連携にはコネクタを手動設定する必要があり非エンジニアには敷居が高い部分がありました。何が足りないかわからないまま止まるユーザーが多かったです。

なぜ重要か

Manusを試したことがある人には最初のセットアップが楽になります。コネクタ設定でつまずいていた人は再チャレンジのタイミングです。エンジニア以外のビジネス職が使うシナリオが現実的になってきます。Manusを知らない・使う予定がない人には今日は関係ありません。

出典: manus.im　·　→ カオスマップで見る

E · Theme of the day

規制・削減・安全性、AIの影が濃くなる

EU規制の先送り、DeepLの大規模削減、ChatGPTの緊急連絡機能と、AI普及が社会に残している宿題が一日に集まりました。

EU AI Actの高リスク対応、2027〜28年まで先延ばし

EU AI Act 完全ガイド

何が起きたか

業界の反発を受け「Digital Omnibus on AI」パッケージにより主要な高リスクAIコンプライアンス期限が2027〜2028年まで先送りされました（中小企業の負担軽減を目的とした規制簡素化）。ディープフェイク・AI生成コンテンツのラベリング義務などは2026年8月に予定通り発効します。「ヌーディフィケーション（nudification）」アプリは引き続き明確に禁止。

以前との違い

EU AI Actの高リスク規制は2026年8月から本格適用の予定でした。採用・信用評価・医療など高リスクカテゴリへの適合に向けて多くの企業が準備を進めてきましたが、業界や中小企業から負担増への反発が強まっていました。

なぜ重要か

2026年8月を目標に準備していた企業は優先度を再評価するタイミングです。ただしディープフェイクとAI生成コンテンツのラベリングは2026年8月のままなので、その対応は変わりません。EU向けに何もしていない会社には今日は直接関係なし。

→ AI 大全で見る

DeepLが社員の4分の1を削減してAIネイティブへ

DeepL

何が起きたか

従業員の約4分の1（約250人）を削減し「AIネイティブ」組織に再編中（競争力維持のための構造改革）

以前との違い

DeepLは欧州発の翻訳サービスとして1,000人規模を抱えていました。ここ1年でChatGPTやGeminiが翻訳品質で急接近し、DeepLの優位性が薄れてきたという声が増えていました。

なぜ重要か

DeepLを業務で使っているチームには、サービス継続の安定性を改めて確認する契機になります。短期的には機能追加のペースが落ちる可能性があります。AIネイティブ再編が成功すれば品質を上げて戻る可能性もあります。DeepLを使っていない人には今日は関係なし。

出典: deepl.com　·　→ カオスマップで見る

ChatGPTが精神的危機を察知して緊急連絡してくれる

ChatGPT

何が起きたか

「Trusted Contact」安全機能を導入（精神的危機を感知した際に指定の信頼できる連絡先へ通知・SMS/メール/アプリ内通知）

以前との違い

AIチャットが精神的に不安定なユーザーとやり取りするケースは増えていましたが、AIにできる対応は緊急相談窓口のリンクを貼る程度でした。緊急連絡先への自動通知機能は主要AIサービスにはありませんでした。

なぜ重要か

メンタルヘルス支援ツールを作っているチームにはUX設計の参考になります。一般ユーザーとしては家族や友人が危険な状態のとき通知を受け取れる立場になる可能性があります。機能のプライバシーへの影響（会話内容が通知のきっかけになる）は賛否が出そうです。

出典: chat.openai.com　·　→ カオスマップで見る

OpenAI、サイバー防衛向けにGPT-5.5の特別版を限定公開

GPT（OpenAI）

何が起きたか

GPT-5.5-Cyberをサイバー防御向け信頼済みアクセスプログラムに追加（重要インフラ保護・脆弱性調査を支援）

以前との違い

OpenAIはChatGPT EnterpriseとDoDの連携を少しずつ拡大してきましたが、サイバーセキュリティ専門向けにカスタムされたモデルを限定公開するのは今回が初めてです。

なぜ重要か

直接使えるのはOpenAIの信頼済みアクセスプログラムに認定された組織だけで、一般エンジニアには今すぐ関係ありません。ただAIがサイバー防衛の現場で使われる前例が積み上がってきています。Claude Mythosと合わせるとAI主導のセキュリティが現実路線に入ってきたのがわかります。

出典: openai.com　·　→ カオスマップで見る

過去のアップデート

サイトに反映された変更を日次でアーカイブしています。

5/8 のアップデート

Anthropicが一段ギアを入れた日

vibe-codingアプリが穴だらけだった

音声APIとモデルが選び放題になる

PCが自分のAI司令塔になり始める

規制・削減・安全性、AIの影が濃くなる

過去のアップデート