複数解像度の複素ガボール辞書とビジョントランスフォーマーによる心音の収縮期雑音分類

arXiv cs.CV / 2026/4/21

📰 ニュースModels & Research

要点

  • 本研究は、マルチレゾリューションの時間—頻度表現とトランスフォーマーに基づく学習を組み合わせて、収縮期の心雑音を自動分類するシステムを提案している。
  • 特徴抽出では、複数解像度の複素ガボール基底関数(GBF)からなる冗長辞書に対して、複素直交マッチング追跡を用いて1つまたは複数の雑音セグメントを射影する。
  • 1つの記録に含まれる複数セグメントでは、同一の辞書を共有しつつ、セグメントごとの重みが同じ基底関数集合に対応するよう制約することで、変数解像度の時間—頻度特徴行列を一貫させる。
  • 分類モデルはビジョントランスフォーマーを用い、異なる解像度の複数入力行列をCNNによるパッチトークン化で処理し、埋め込みトークンを連結したうえで、多頭注意・残差接続・1×1畳み込みを含むエンコーダ層に通す。
  • CirCor DigiScopeデータセットの収縮期雑音4種類での実験により、有効性が示され、分類精度は95.96%に達した。

\%$に達します。