非構造テキストからの自動オントロジー生成に向けて:マルチエージェントLLMアプローチ

arXiv cs.AI / 2026/4/28

💬 オピニオンIdeas & Deep AnalysisModels & Research

要点

  • 本研究は、非構造の自然言語テキストから形式的オントロジーを自動生成する際に、生成品質へ最も影響するLLMのアーキテクチャ設計上の要因と、既存手法が失敗する理由を明らかにすることを目的とする。
  • 保険契約というドメイン固有のデータを用い、まず単一エージェントのLLMベースラインを構築し、オントロジーデザインパターンの不適合、構造の冗長性、反復修正の効果不足といった主要な失敗モードを特定する。
  • 次に、オントロジー構築を4つの成果物駆動ロール(Domain Expert、Manager、Coder、Quality Assurer)に分解するマルチエージェントLLMアーキテクチャを提案する。
  • 評価は、異質なLLMジャッジによるアーキテクチャ品質評価と、SPARQLのコンピテンシ質問に基づく評価(補完的にRAGベースの評価も併用)を組み合わせて行う。
  • 結果として、マルチエージェント方式は構造品質を大きく改善し、クエリ容易性も控えめに向上することが示され、その主因は前倒しの計画(front-loaded planning)にある。