要約: 自然言語を実行可能な構造化されたアクションへ翻訳するエージェント型AIシステムにとって、関数呼び出しを行う言語モデルは不可欠ですが、既存のモデルはアラビア語に適用すると深刻な構造的不安定性を示します。
私たちは AISA-AR-FunctionCall を提示します。これは 270M パラメータの FunctionGemma をバックボーンとし、体系的なデータセット監査、スキーマ修復、ツールを意識したプロンプト再構成、そして全パラメータを対象とした教師付きファインチューニングによって訓練された、生産運用を意図したアラビア語の関数呼び出しフレームワークです。
保持したテストセットにおいて、ファインチューニングはパース失敗を87%から1%未満へ、関数名の正確性を8倍超に改善し、方言およびドメインを横断した引数の整列性を大幅に高めます。
誤り分析は、構造的崩壊から意味的ずれへの移行を明らかにし、シリアライズ安定性と意思決定レベルの推論が分離可能な課題であることを示唆しています。
さらに、ツールの呼び出し前に明示的な中間推論を導入する推論強化型 LoRA 変種を検討します。
すべてのデータセットとモデルは AISA フレームワークの下で公開されています。