AI Navigate

インサイト最新記事一覧 AI大全

多言語言語モデルにおけるドメイン固有の並列データを活用した、低資源言語翻訳のための手法

arXiv cs.CL / 2026/3/27

💬 オピニオンIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

多言語シーケンス・トゥ・シーケンス言語モデル（msLM）を用いたニューラル機械翻訳は、低資源言語で並列データ量やモデル内での言語表現が不足すると期待性能を満たしにくい。
低資源かつドメイン特化のNMTでは、補助ドメインの並列データを「ファインチューニング」または「追加の事前学習（further pre-training）」に使うことで性能改善が見込める。
提案手法の有効性を、ドメイン特化の低資源言語翻訳の文脈で評価し、補助データのドメイン乖離（domain divergence）が性能に与える影響も検討している。
補助並列データを用いたドメイン特化NMT構築に関する複数の推奨戦略を提示している。

広告

関連記事

AIが考える「最強のプログラミング言語」、実際につくって動かしてみた

AIが考える「最強のプログラミング言語」、実際につくって動かしてみた

日経XTECH

STADLER、230年の歴史を持つ企業でナレッジワークを再構築

STADLER、230年の歴史を持つ企業でナレッジワークを再構築

OpenAI Blog

AI研究は地政学から切り離すことがますます難しくなっている

AI研究は地政学から切り離すことがますます難しくなっている

Wired

ゼロトラストのガバナンス保証を備えた円環型製造サプライチェーンのためのスパース分散表現学習

ゼロトラストのガバナンス保証を備えた円環型製造サプライチェーンのためのスパース分散表現学習

Dev.to

Claude Mythosをめぐるうわさ：リークされたAnthropicの投稿が強力な次期モデルを示唆

Claude Mythosをめぐるうわさ：リークされたAnthropicの投稿が強力な次期モデルを示唆

Reddit r/artificial

関連おすすめサービス

※当サイトはアフィリエイト広告を利用しています

Notta搭載AI議事録イヤホン ZENCHORD1

AI時代の仕事術。Notta搭載で会議の議事録を自動生成するスマートイヤホン。

AI搭載ボイスレコーダー Plaud

世界100万人が愛用。AIで文字起こし・要約を自動化するボイスレコーダー。

画像高画質化AIツール Aiarty Image Enhancer

AIで画像を高画質化。写真・イラストを簡単にアップスケール。