OpenMOSSが「MOSS-Audio」をリリース:音声・環境音・音楽・時間認識型オーディオ推論のオープンソース基盤モデル

MarkTechPost / 2026/4/28

📰 ニュースSignals & Early TrendsIndustry & Market MovesModels & Research

要点

  • OpenMOSSは、音声・環境音・音楽・時間を考慮したオーディオ推論を1つのアーキテクチャで扱うオープンソース基盤モデル「MOSS-Audio」をリリースした。
  • 発表では、MOSS-Audioは汎用オーディオベンチマークで評価されたすべてのオープンソースモデルを上回ると主張している。
  • さらに、4倍以上の規模を持つより大きなオープンソースシステムよりも優れた性能だと比較されている。
  • 複数の音声・時間推論タスクを統合することで、MOSS-Audioは開発者や研究者向けにより汎用的なオーディオ理解・推論能力の提供を目指している。

このモデルは、音声、環境音、音楽、時間的推論を単一のアーキテクチャに統合し——さらに、一般的なオーディオ・ベンチマークでテストしたあらゆるオープンソース・モデルを上回ります。しかも、そのサイズは自身の4倍以上のシステムも含みます。

投稿 OpenMOSS Releases MOSS-Audio: An Open-Source Foundation Model for Speech, Sound, Music, and Time-Aware Audio Reasoning は、MarkTechPost に最初に掲載されました。