DeepSeek、AIビジョンを追加する大きな動き：「クジラが今や見える」

SCMP Tech / 2026/4/29

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

共有:

要点

DeepSeekは、フラッグシップのチャットボットにマルチモーダルAI機能を追加し、新たな「画像認識モード」によってテキストに加えて画像や動画を処理できるようにしました。
この機能はまず一部のユーザーに限定して提供され、「expert」や「flash」といった既存モードに加えて体験を広げる狙いがあります。
今回のアップデートは、新しいフラッグシップモデルV4の発表と、その後の大幅な価格改定から数日後に行われ、開発・改善のスピード感を示しています。
マルチモーダルチームのリーダーである陳小康氏は、今回の強化を「見える」能力の大きな前進として位置づけるコメントをしています。

Chinese artificial intelligence start-up DeepSeek has added multimodal capabilities to its flagship chatbot for the first time – meaning that it can process images and video in addition to text – bringing it in line with rivals that already offer the function.
The limited release to select users comes just days after the Hangzhou-based company released its new flagship model V4, which was followed by extensive price cuts.
According to DeepSeek multimodal team leader Chen Xiaokang, who made the...

この記事の続きは原文サイトでお読みいただけます。

原文を読む →

Black Hat USA

AI Business

新体制のトヨタ、E2E自動運転で「キャッチアップ」へ部品種削減にも注力

日経XTECH

富岳NEXT「世界一狙わず」理研・富士通・NVIDIA、AI時代の使われる計算機へ

日経XTECH

AIエージェントを使ってチームの「生きたナレッジベース」を維持する方法

Dev.to

ik_llama.cpp が Qwen3.5 MTP をサポート開始

Reddit r/LocalLLaMA

DeepSeek、AIビジョンを追加する大きな動き：「クジラが今や見える」

要点

関連記事

Black Hat USA

新体制のトヨタ、E2E自動運転で「キャッチアップ」へ部品種削減にも注力

富岳NEXT「世界一狙わず」理研・富士通・NVIDIA、AI時代の使われる計算機へ

AIエージェントを使ってチームの「生きたナレッジベース」を維持する方法

ik_llama.cpp が Qwen3.5 MTP をサポート開始

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

Black Hat USA

新体制のトヨタ、E2E自動運転で「キャッチアップ」へ 部品種削減にも注力

富岳NEXT「世界一狙わず」 理研・富士通・NVIDIA、AI時代の使われる計算機へ

AIエージェントを使ってチームの「生きたナレッジベース」を維持する方法

ik_llama.cpp が Qwen3.5 MTP をサポート開始

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

新体制のトヨタ、E2E自動運転で「キャッチアップ」へ部品種削減にも注力

富岳NEXT「世界一狙わず」理研・富士通・NVIDIA、AI時代の使われる計算機へ