60の専門エージェントとリアルタイムの法令検証を備えたAI法務OSを構築した

Dev.to / 2026/3/12

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • Lawmadi OSは、60の分野特化エージェントを搭載したAI法務オペレーティングシステムで、全ての回答を韓国政府のライブデータベースと照合して法的幻覚を防ぎます。
  • 遅延を抑えつつ高い精度とコスト効率を実現する3層NLUルーティングアプローチを採用しています(264/264のテストケースをクリア)。
  • 60のエージェントそれぞれが韓国法の異なる分野を専門とし、労働、賃貸、離婚、交通、刑事法などの領域で法令を前提とした正確な回答を提供します。
  • 4段階の検証パイプラインを備え、法令の引用を抽出、law.go.krをAPI経由で照会、存在と内容の正確性を検証し、回答を拒否するかを決定する0-100の検証スコアを付与します。
  • 10の政府データソース(法令、施行令、施行規則、裁判例、行政規則等)を横断照合し、誤った法情報の公開を防ぐフェイル・クローズ設計を用います。

韓国で法的な問題に直面したとき、人々には3つの悪い選択肢があります:セッションごとに高額な弁護士費用($75以上)、信頼できないインターネット検索、実在しない法を幻視するAIチャットボット。

私はこの問題を解決するためにLawmadi OSを作りました。これは、60の分野特化エージェントを備え、すべての回答をライブの政府データベースと照合するAI法務OSです。

ライブ: lawmadi.com

法的AIの問題点

韓国の労働法についてChatGPTに尋ねると、自信満々に「労働基準法第27条」と引用します — ただしその条文が主張する内容を述べていなかったり、そもそも条文自体が存在しない可能性があります。法的分野では、幻覚は単なる厄介な問題ではなく、危険です。人々は法的情報に基づいて人生を左右する決定を下します。

Lawmadi OSの仕組み

3層NLUルーティング

すべてのクエリを高価なLLM分類ステップに通す代わりに、階層的なルーティングを採用しています:

これにより、ほとんどのクエリで低遅延、高い精度(264/264のテストケースをクリア)、コスト効率を実現します。

60の専門エージェント

60の各エージェントは韓国法の特定の分野を専門とします:

  • L09 담우 — 労働法(不当解雇、未払い賃金)
  • L08 온유 — 賃貸/賃借法(전세デポジット、入居者の権利)
  • L03 담슬 — 離婚・家族法
  • L10 결휘 — 交通事故
  • L01 휘율 — 犯罪法
  • そして税法、知的財産、移民、相続、医療、軍事、環境、データプライバシー、スタートアップ等を含む計55分野

なぜ60にするのかというと、専門化が重要だからです。各エージェントはドメイン特有のプロンプト、関連する法令の知識、最適化された応答パターンを持ちます。1人のジェネラリストではなく60人の専門家を擁する法律事務所のようなものです。

4段階の検証パイプライン

これがLawmadi OSを他と差別化するコアアーキテクチャです:

Stage 4はLawmadi OSを他と差別化するポイントです。Geminiが回答を生成した後、私たちは以下を実行します:

  1. Extract — 回答からすべての法令引用を抽出
  2. Query — 법제처, law.go.kr の公式立法データベースをDRF API経由で照会
  3. Verify — 法令は存在するか?条文番号は存在するか?内容は正確か?
  4. Score — 0-100の検証スコアを生成
  5. Decide — スコアが閾値を下回る場合、回答全体を拒否

私たちは10の政府データソースを横断照合します:

  • 法令
  • 施行令
  • 施行規則
  • 裁判例
  • 行政規則
  • その他5つ

フェイル・クローズ設計

検証APIがダウンしても、未検証の回答へフォールバックしません。代わりに:

  • 連続失敗後に回路遮断器が作動します
  • システムはフェイル・クローズモードに入ります
  • 検証が可能になるまで全回答を保留します
  • 未検証の回答を出すより、回答を出さない方が良い

5段階の共感フレームワーク

法的問題はストレスがかかるものです。各回答は次の構成に従います:

  1. 感情的な認識 — 「この状況はつらいはずです…」
  2. 状況の診断 — 法的問題の明確な分析
  3. 行動計画 — 締切を含む具体的な手順
  4. セーフティネット — 法的支援リソース、ホットライン、政府サービス
  5. サポートする結論 — 励ましと次のステップ

1週間後の結果

指標
ユニーク訪問者数 114
処理されたクエリ数 481
成功率 99.6%
平均検証スコア 84.7/100
韓国語出典の正確さ 82.5%
英語出典の正確さ 25.6%(改善中)
テスト合格数 282/282
平均応答時間 約40秒

最も人気のある領域: 労働法(90件)、住宅/賃貸(83)、離婚(50)、交通事故(48)

技術スタック

構成要素 技術
バックエンド FastAPI 0.128.0 + Python 3.10+
LLM Google Gemini 2.5 Flash
RAG Vertex AI Search (14,601 docs)
検証 법제처 DRF API (10 SSOT sources)
データベース Cloud SQL PostgreSQL 17
ホスティング GCP Cloud Run + Firebase
課金 Paddle (クレジットベース)
CI/CD GitHub Actions (5段階パイプライン)
認証 JWT RBAC + Email OTP
悪用防止 IP + Canvas Fingerprint + Device Token

料金

  • 無料: 1日あたり2クエリ(アカウント不要)
  • Starter: 20クエリ — 0.50ドル
  • Standard: 100クエリ — 0.99ドル
  • Pro: 300クエリ — 0.99ドル

クレジット制、サブスクリプションはありません。Paddleによる提供。

課題と今後の展望

  1. 待機時間 — 平均約40秒は遅すぎます。Gemini生成(約30秒)がボトルネック。並列RAGと事前取得(prefetch)を検討中。
  2. 英語の出典 — 韓国語出典の82.5%に対して英語出典は25.6%の正確さ。韓国法名の英語表記の標準化は一貫していません。
  3. 規模 — 60個のシステムプロンプトを維持。自動プロンプト生成の検討をしています。

試してみる

以下についてのご意見をぜひお聞かせください:

  • マルチエージェントの専門性 vs 単一のジェネラリストアプローチ
  • AIシステムにおけるフェイルクローズ検証
  • 応答遅延を低減するアイデア

Jainam Choe によって作成 — choepeter@outlook.kr