要旨: エスペラントやクウェンヤのような構築言語(conlang)は、芸術、哲学、国際コミュニケーションにおいて多様な役割を果たしてきました。一方で、基盤モデルは、テキスト、画像、そしてそれ以外の領域における創造的生成を一変させました。本研究では、エンドツーエンドのconlang生成に向けて、現代のLLMを計算創造性の補助として活用します。私たちは、言語設計をモジュール化された段階――音韻論、形態論、統語論、語彙生成、翻訳――へと分解する、多ホップのパイプラインであるConlangCrafterを提案します。各段階において、本手法はLLMのメタ言語的推論能力を活用し、多様性を促すためにランダム性を注入するとともに、創発する言語記述の整合性を促すために自己洗練(self-refinement)のフィードバックを利用します。この課題に対して、一貫性および類型論的多様性を測る指標を評価する、新規で拡張可能な評価フレームワークを構築します。自動評価および手動評価の結果は、人間の言語学的専門知識がなくても、ConlangCrafterが首尾一貫した多様なconlangを生成できることを示しています。
ConlangCrafter:マルチホップLLMパイプラインで構築言語を作る
arXiv cs.CL / 2026/4/20
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、音韻・形態・統語・語彙生成などのモジュール化された段階に分けて構築言語(コンラング)を生成する、エンドツーエンドのマルチホップLLMパイプライン「ConlangCrafter」を提案している。
- 各段階でLLMの「メタ言語推論」能力を活用し、多様性を促すためのランダム性の注入と、自己改善フィードバックによる一貫性の維持を組み合わせている。
- 一貫性と類型論的多様性の両面に着目した指標を用いる、スケーラブルな評価フレームワークも新たに提示している。
- 自動評価および手動評価の結果から、人間の言語学的専門知識なしでも、ConlangCrafterは首尾一貫した多様なコンラングを生成できることが示唆されている。
- 全体として、この研究は言語デザインにおける創造的支援として近年のLLMを位置づけ、生成・洗練・評価を一つのワークフローに統合している。



