実時間の政策制約下での継承言語の revitalization プログラムのための人間整合型 Decision Transformer

Dev.to / 2026/6/16

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

共有:

要点

この記事は、通常の次トークン予測型言語モデルが、データ量の乏しさや文化的な文脈（プラグマティクス）の欠如により、絶滅危惧の継承言語ではうまく機能しにくいと主張しています。
生成を「return-to-go（目標報酬）」に基づく逐次の意思決定問題として扱うため、Decision Transformer を継承言語向けに適応する提案が示されています。
方言の優先や「純粋さ」vs「実用性」のバランスといった方針・文化的要件は、報酬関数やペナルティとしてエンコードできます。
長老や話者による人間のフィードバック（評価）を取り込み、生成内容を文化的な威信や文脈に合わせることができます。
著者は、メイ（Māori）の revitalization を実時間の政策制約下で行うために、失敗・ブレークスルー・動くコードまで含めた取り組みの経緯を共有する予定です。

この記事の続きは原文サイトでお読みいただけます。