このモデルは、音声、環境音、音楽、時間的推論を単一のアーキテクチャに統合し——さらに、一般的なオーディオ・ベンチマークでテストしたあらゆるオープンソース・モデルを上回ります。しかも、そのサイズは自身の4倍以上のシステムも含みます。
投稿 OpenMOSS Releases MOSS-Audio: An Open-Source Foundation Model for Speech, Sound, Music, and Time-Aware Audio Reasoning は、MarkTechPost に最初に掲載されました。
