要旨: 私は、インドの言語だけで完全に表現された最初のオリジナルで現代的なコンピュータサイエンスの研究論文を書いた経験を述べます。その論文はテルグ語で書かれており、テルグ語は約1億人の話者を持つ言語です。この論文は分散コンピューティングの分野にあり、多プロセッサ・アルゴリズムに対する知識論理(epistemic logic)の基盤となる下界を証明するための技術を導入します。この論文を書く上での主要な障害は、アルゴリズム、分散コンピューティング、離散数学といった高度なコンピュータサイエンスの概念に関する技術用語を開発することでした。私は、サンスクリット文法である強力で生産的なパーニニ文法(P\=aninian grammar of Samskrtam)によって、母語の科学的な用語を導出し、創作することで、この課題を克服しました。論文の組版も追加の課題でした。というのも、テルグ語における数学的組版は未発達だからです。私はこの問題を、テルグ語のXeLaTeXテンプレートを開発することで解決しました。私はそれを TeluguTeX と呼びます。インドの言語でオリジナルのコンピュータサイエンス研究論文を書いたというこの経験を踏まえ、さらにサンスクリットの技術語彙を発展させ、また技術面での国際化を進めることで、インド系言語(母語話者が10億人を超える言語)における、あらゆる水準での科学的文章作成の状況をどのように改善しうるかについての展望を示します。
インドの言語で書かれた最初の計算機科学研究論文と、インド諸言語における科学の未来
arXiv cs.CL / 2026/4/7
📰 ニュース
要点
- この記事は、著者が「インドの言語だけで、特にテルグ語で表現された、計算機科学に関する最初のオリジナルの近代的研究論文」であると主張するものを書き上げるまでのプロセスを述べており、分散コンピューティングと、マルチプロセッサ・アルゴリズムに対するエピステミック論理の下界に焦点を当てている。
- 中核となる課題は、高度な計算機科学および数学の概念に対する技術用語をテルグ語で作り出すことだった。著者は、パーニニ文法とサンスクリットの技術語彙を通じたサンスクリット由来の言語的生産性を活用し、それを拡張することでこの問題に対処した。
- 著者はまた、テルグ語での数学的組版が十分に整備されていなかったことを報告しており、その解決として「TeluguTeX」という専用のテルグ語 XeLaTeX 組版テンプレートを構築した。
- 単一の論文を超えて、この文章は、サンスクリットの技術語彙の進展と「テクノロジーの国際的な相互適用化(technological internationalization)」を用いて、インド系言語全体での科学的な文章作成を改善することを主張する。そうすることで、学術的な成果の作成がより一層手に届くものになると論じる。
- この取り組みは、個人的な研究執筆の記録であると同時に、言語技術や標準化された語彙が、インド系言語による科学をどのように加速し得るかというより広い構想として機能している。
- categories