バイオマーカー監視を用いたハンチントン病の自動音声認識
arXiv cs.LG / 2026/3/13
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本論文は高忠実度の臨床音声コーパスを用いてハンチントン病(HD)の自動音声認識を研究し、統一評価の下で複数のASRファミリーを比較している。
- HDの音声はアーキテクチャ固有の誤り挙動を誘発し、Parakeet-TDTがエンコーダ-デコーダおよびCTCのベースラインを上回る。
- HD特有の適応によりHDコーパスでの語彙誤り率(WER)を6.99%から4.95%へ低減する。
- 著者はバイオマーカーに基づく補助監視手法を提案し、エラー挙動が疾患の重症度とともに変化することを分析し、WERを一様に改善することはないと示している。
- すべてのコードとモデルはオープンソース化され、再現性と今後の研究の促進を図っている。
概要: 自動音声認識(ASR)を病理的な音声に適用する研究は十分には進んでおらず、特にハンチントン病(HD)では、時間の不規則性、発声の不安定さ、談話の歪みが現行モデルの課題となる。これまでエンドツーエンドASR訓練に用いられてこなかった高忠実度の臨床音声コーパスを用い、HD-ASRの体系的な研究を提示する。統一評価の下で複数のASRファミリーを比較し、WERだけでなく置換・削除・挿入のパターンも分析する。HDの音声はアーキテクチャ固有の誤りレジームを誘発し、Parakeet-TDTがエンコーダ-デコーダおよびCTCのベースラインを上回る。HD特有の適応により、HDコーパスでのWERが6.99%から4.95%へ低減し、バイオマーカーに基づく補助監視の方法を提案するとともに、エラー挙動が均一なWER改善ではなく重症度依存的に再形成されることを分析する。全コードとモデルをオープンソース化する。
