実時間の政策制約下での継承言語の revitalization プログラムのための人間整合型 Decision Transformer

Dev.to / 2026/6/16

💬 オピニオンIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • この記事は、通常の次トークン予測型言語モデルが、データ量の乏しさや文化的な文脈(プラグマティクス)の欠如により、絶滅危惧の継承言語ではうまく機能しにくいと主張しています。
  • 生成を「return-to-go(目標報酬)」に基づく逐次の意思決定問題として扱うため、Decision Transformer を継承言語向けに適応する提案が示されています。
  • 方言の優先や「純粋さ」vs「実用性」のバランスといった方針・文化的要件は、報酬関数やペナルティとしてエンコードできます。
  • 長老や話者による人間のフィードバック(評価)を取り込み、生成内容を文化的な威信や文脈に合わせることができます。
  • 著者は、メイ(Māori)の revitalization を実時間の政策制約下で行うために、失敗・ブレークスルー・動くコードまで含めた取り組みの経緯を共有する予定です。

この記事の続きは原文サイトでお読みいただけます。

原文を読む →