「Qwen3.5-Omni」が登場、文章生成・コード生成・映像認識・音声合成・ウェブ検索が可能

GIGAZINE / 3/31/2026

📰 NewsSignals & Early TrendsModels & Research

共有:

Key Points

「Qwen3.5-Omni」を新たに提供開始し、文章生成・コード生成をはじめとするマルチ用途に対応するAIとして位置付けられています。
映像認識と音声合成まで対応し、テキスト中心ではない入力/出力（マルチモーダル）での利用が可能になった点が強調されています。
ウェブ検索にも対応することで、ユーザーの質問に対して外部情報を参照しながら回答を組み立てる体験を想定していることが示唆されています。
これにより、既存のチャット/コーディング用途に加えて、音声・動画を含む制作や調査ワークフローへの組み込み可能性が広がります。

AlibabaのAI研究チームであるQwen(Tongyi Lab)が「Qwen3.5-Omni」を2026年3月30日に発表しました。Qwen3.5-Omniはテキスト・画像・音声・動画の理解が可能なオムニモーダルモデルで、テキストだけでなく音声も生成することが可能。音声と映像の理解能力はGemini 3.1 Proを超えているとアピールされています。

続きを読む...

Continue reading this article on the original site.

Read original →