「もっとマルチリンガルに考える:コードスイッチする推論モデルを教えるためのデータ効率的フレームワーク」
arXiv cs.CL / 2026/4/20
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、言語学的・行動学的な動機づけにもとづき、推論を行う大規模言語モデルにコードスイッチを学習させるためのデータ効率的な微調整フレームワークを提案しています。
- 研究チームはまず、多様なモデル・言語・タスク・ドメインにわたる「推論トレース」のデータセットを構築し、既存の推論モデルに見られるコードスイッチ行動の特徴を体系的に分析しました。
- その上で、有益なコードスイッチを伴う推論行動を促す微調整介入を設計し、比較的少ないデータ量でそれらの行動を大きく改善できることを示しています。
- さらに、推論におけるコードスイッチを直接は示さないタスク(機械翻訳など)で微調整しても、推論モデルのコードスイッチ行動を変えられることを報告しています。


