SeaAlert:大規模言語モデルによる海上遭難通報からの重要情報抽出

arXiv cs.AI / 2026/4/17

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本論文では、安全性に直結する海上の遭難VHF音声通信から重要情報を頑健に抽出することを目的に、LLMベースのフレームワーク「SeaAlert」を提案している。
  • GMDSSの標準手順からの逸脱、短くノイジーな通報、話者の緊張やチャネルノイズによって生じるASRの転記誤りといった実運用上の課題に焦点を当てている。
  • ラベル付き実データの不足に対処するため、LLMを用いて現実的で多様な海上遭難メッセージを生成する合成データ生成パイプラインを開発している。
  • さらに、生成した発話を音声合成しVHFノイズで劣化させたうえでASRにかけ、現実的なノイズ付き転写を得て学習・評価に活用できるようにしている。

要旨: 超短波(VHF)無線によって送信される海上の遭難通信は、海上での緊急事態を報告するために用いられる安全性に直結する音声メッセージである。グローバル海上遭難・安全システム(GMDSS)のもとでは、このようなメッセージは標準化された手順に従い、船舶の識別情報、位置、遭難の性質、必要とされる支援といった、必須の詳細を伝えることが期待される。しかし実際には、遭難メッセージがしばしば短く、ノイズが多く、ストレス下で生成されること、また規定された形式から逸脱する可能性があることに加え、チャネルノイズや話者のストレスによって引き起こされる自動音声認識(ASR)の誤りによってさらに劣化するため、自動分析は依然として困難である。 本論文は、海上遭難通信の堅牢な解析のためのLLMベースの枠組みSeaAlertを提示する。ラベル付きの実世界データの希少性に対処するため、我々は合成データ生成パイプラインを開発し、その中でLLMが現実的かつ多様な海上メッセージを生成する。そこには、標準的な遭難コードワードが省略される、あるいはより明示性の低い表現に置き換えられるといった、困難な変種も含まれる。生成された発話は音声として合成され、シミュレートしたVHFノイズで劣化させられ、ASRシステムによって文字起こしされることで、現実的なノイズを含む転写データが得られる。