GA-VisAgent:対話型学習のためのコード生成と可視化に向けたマルチエージェントアプリケーション

arXiv cs.LG / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 本論文では、幾何代数(GA)のコード生成と可視化を行うことでGA概念を理解しやすくする、マルチエージェントの対話型学習アプリ「GA-VisAgent」を提案する。
  • GA-VisAgentは幾何代数向けLLM(GAGPT)を土台に、タスク計画とReAct推論を組み合わせ、幾何積・回転・反射などの操作を含む複雑な処理を標準化された5つのサブタスクに分解できる。
  • ユーザーは自然言語または数式として入力でき、システムは実行可能なコードを自動生成すると同時に、理解を助ける対話的な可視化を提示する。
  • 実験では、適合的(conformal)GAタスク40件でコード生成成功率90%を達成し、GPT-4oに対して70%の改善が報告されている。
  • 著者らはGA-VisAgentを、GA教育と関連する数学概念の可視化ツール開発のための拡張可能な新しいパラダイムとして位置づけ、オンラインサービスも公開予定としている。

要旨: 幾何代数(Geometric Algebra: GA)は、その高度に抽象的な数学的構造と複雑な演算規則のため、学習者にとって課題が多い。関連するコードを開発する際に、代数操作を具体的な幾何学的解釈へと翻訳することは直感的ではなく、そのため学習が難しくなる。現在、既存のいくつかのGAソフトウェアパッケージは、コード生成と可視化のために手書きのスクリプトに依存しているが、その学習曲線が急であることが普及を妨げている。一方で、大規模言語モデル(LLM)に基づく手法は、GAALOPScript のような特定のGAスクリプトを生成する際に論理エラーを生じがちで、その結果、一般的に精度が低くなる。本研究では、幾何代数の大規模言語モデル(GAGPT)を土台として、GAコード生成と可視化のためのマルチエージェント・インタラクティブ学習アプリケーションである GA-VisAgent を提案する。タスク計画メカニズムと ReAct 推論戦略を統合することで、GA-VisAgent は回転や反射といった幾何学的積などの中核操作を含む、5つの標準化されたサブタスクへと複雑な操作を分解できる。入力として自然言語と数学的数式を受け取り、自動的に実行可能なコードを生成し、ユーザーの理解を助ける対話的な可視化を伴う。実験結果では、GA-VisAgent は代表的な Conformal GA タスク40件にわたってコード生成成功率90%を達成し、GPT-4o に比べて70%の改善を示した。このアプリケーションは、GAを教えるための拡張可能な新しいパラダイムと、関連する数学的概念のための可視化ツール開発を導入する。本プロジェクトのオンラインサービスは http://gagis.cn/gacrac で利用可能となる。