ベースバンドを超えて:フルスペクトラム・バイオアコースティクス分類のための適応的マルチバンド符号化
arXiv cs.LG / 2026/5/1
📰 ニュースModels & Research
要点
- 本論文は計算バイオアコースティクスの重要な制約として、16 kHz学習済みモデルに依存するため0〜8 kHzのベースバンドに限定され、超音波領域を含む情報を捨ててしまう点を扱います。
- 動物の発声音の全スペクトルを周波数帯の特徴に分解し、それらを単一の表現へ融合する「適応的マルチバンド符号化」フレームワークを提案します。
- 8つの事前学習モデルと5つの融合戦略を用い、3つのバイオアコースティクス・データセットで実験した結果、融合表現がベースバンドおよび時間拡張ベースラインよりも概ね優れることが2データセットで示されます。
- 分析では、特定のエンコーダがバンド間で相関の低い埋め込み(デコリレートされた埋め込み)を生成し、その結果として融合後のクラス分離が改善する可能性が示唆されます。




