DeepSeekがAIビジョンを追加：大きな一手で「クジラが見えるようになった」

SCMP Tech / 2026/4/29

📰 ニュースSignals & Early TrendsTools & Practical UsageIndustry & Market Moves

共有:

要点

DeepSeekはチャット・インターフェースに「画像認識モード」を導入し、テキストのみ、またはチャット形式のやり取りにとどまらない形へと製品を拡張しました。
新しいビジョン機能は、既存の「expert」および「flash」モードに並ぶ3つ目のチャットモードとして位置づけられています。
今回の更新は、ユーザーが画像を入力し、認識・理解に関する応答を得られるマルチモーダル・アシスタントへの移行が進んでいることを示唆します。
これにより、視覚的な解釈が必要な（分析、検索、モデレーションなど）ワークフローにおいて、開発者やチームがDeepSeekをどのように統合するかに影響が出る可能性があります。

中国の人工知能スタートアップであるDeepSeekが、初めて主力チャットボットにマルチモーダル機能を追加しました。つまり、テキストに加えて画像や動画を処理できるようになり、すでに同機能を提供している競合他社に追いつく形となります。

提供は一部のユーザーに限定されたものの、そのリリースは、杭州に拠点を置く同社が新しいフラッグシップモデルV4を公開してからわずか数日後に行われました。V4の公開に続いて、大幅な価格改定も実施されています。

マルチモーダル・チームのリーダーであるChen Xiaokang氏によると、同...

この記事の続きは原文サイトでお読みいただけます。