広告

Top-down string-to-dependency ニューラル機械翻訳

arXiv cs.CL / 2026/3/31

📰 ニュースIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、長い入力であって、訓練データ中で稀または存在しない語に対する翻訳において、注意機構ベースのエンコーダ・デコーダ型ニューラル機械翻訳モデルの弱点を扱う。
  • 通常のシーケンス・ツー・シーケンス復号ではなく、左から右へという生成順序のもとでトップダウンに生成し、目的言語の依存関係ツリーを出力する構文デコーダを提案する。
  • 実験結果から、トップダウンの string-to-dependency-tree アプローチは、長く、訓練時の分布外(out-of-training-distribution)入力に対してより良く一般化できることが示される。
  • 中核となる考え方は、NMT の訓練における長さやカバレッジの欠落(ギャップ)を緩和するために、目的側の構文を明示的に取り込むことにある。

広告