要旨: 自然災害や人為的な災害の最中において、タイムリーで信頼性の高い多言語コミュニケーションは極めて重要ですが、危機コミュニケーションのための効果的な解決策の開発は、厳選された並列データの不足によって限界があります。そこで本研究では、一般コーパスからデータを取得し、フィルタリングすることで、小規模な参照コーパスを拡張するドメイン適応型パイプラインを提案します。その結果得られたデータセットを用いて、危機領域向けの翻訳のための小さな言語モデルを微調整し、その後、嗜好(プレファレンス)最適化を適用して、出力をCEFR A2レベルの英語へとバイアスします。自動評価および人手評価の結果、この手法は適切さ(adequacy)を維持しつつ可読性を改善することが示されました。本研究の結果は、ドメイン適応と組み合わせた簡易英語が、完全な多言語カバーが現実的に不可能な場合に、緊急時コミュニケーションのための実用的なリンガ・フランカとして機能し得ることを示しています。
プレッシャー下での翻訳:危機コミュニケーション向けドメイン対応LLM
arXiv cs.AI / 2026/4/30
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、自然災害や人為災害の際に必要となる多言語での迅速かつ信頼性の高い伝達を、整備された並列データの不足という制約の中でどう実現するかを扱っています。
- 小規模な参照コーパスを、一般コーパスから取得してフィルタリングしたデータによって拡張するドメイン適応型のパイプラインを提案しています。
- 得られた危機ドメインのデータセットで小型言語モデルを微調整し、その後に選好最適化を用いて出力をCEFR A2レベルの英語へ寄せます。
- 自動評価と人手評価の結果、可読性が向上しつつ適切性(adequacy)も維持されることが示されています。
- 言語カバレッジを全面的に確保できない緊急時に、簡易英語とドメイン適応の組み合わせが実用的な“共通語”として機能し得ると結論づけています。



