広告

絶滅危惧言語の記録のための自動音声認識:伊計真宮古語の事例研究

arXiv cs.AI / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、日本の沖縄にある、極めて深刻な危機にある琉球語である伊計真宮古語を記録するための自動音声認識(ASR)システムの開発に関する進行中の事例研究を提示する。
  • 著者らはフィールド録音から音声コーパスを構築し、文字誤り率(CER)が15%まで低いASRモデルの学習結果を報告する。
  • 本研究は、ASR支援が文字起こしの効率に与える影響を評価し、文字起こし時間と認知的負荷の両方を大幅に削減できることを見出す。
  • 本成果は、ASRを絶滅危惧言語の記録に向けた実用的でスケーラブルなテクノロジー活用の道筋、ならびに言語活性化の取り組みの可能性として位置づける。

Abstract

言語の衰退は、世界的に言語の多様性に対する大きな課題であり、技術の進歩によって記録と活性化のための新たな道が開かれてきました。その中でも、自動音声認識(ASR)は、危機言語データの文字起こしを支援する可能性が高まっています。本研究では、日本の沖縄で話される、深刻に危機に瀕した琉球語である伊計馬語(Ikema)に焦点を当てます。残存話者は約1,300人で、その大半は60歳以上です。本稿では、現地での録音に基づいて伊計馬語のためのASRシステムを開発する取り組みの進行中の内容を提示します。具体的には、(1) 現地録音から{ otaldatasethours}時間の音声コーパスを構築し、(2) 文字誤り率(character error rate)が15 extbf{%}(15%ではなく15 extbf{%}の可能性あり) にまで低いASRモデルを訓練し、(3) 音声の文字起こしにおいてASR支援が効率に与える影響を評価します。結果は、ASRを統合することで、文字起こし時間と認知的負荷を大幅に削減できることを示しており、危機言語の記録を、技術支援によって大規模に実現するための実用的な道筋を提供します。

広告