OpenMOSSが「MOSS-Audio」をリリース：音声・環境音・音楽・時間認識型オーディオ推論のオープンソース基盤モデル

MarkTechPost / 2026/4/28

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

共有:

要点

OpenMOSSは、音声・環境音・音楽・時間を考慮したオーディオ推論を1つのアーキテクチャで扱うオープンソース基盤モデル「MOSS-Audio」をリリースした。
発表では、MOSS-Audioは汎用オーディオベンチマークで評価されたすべてのオープンソースモデルを上回ると主張している。
さらに、4倍以上の規模を持つより大きなオープンソースシステムよりも優れた性能だと比較されている。
複数の音声・時間推論タスクを統合することで、MOSS-Audioは開発者や研究者向けにより汎用的なオーディオ理解・推論能力の提供を目指している。

このモデルは、音声、環境音、音楽、時間的推論を単一のアーキテクチャに統合し——さらに、一般的なオーディオ・ベンチマークでテストしたあらゆるオープンソース・モデルを上回ります。しかも、そのサイズは自身の4倍以上のシステムも含みます。

AI Business

日経XTECH

日経XTECH

日経XTECH

日経XTECH