ルール・ステート推論(RSI):ルールに基づく領域におけるコンプライアンス監視のためのベイズ的フレームワーク

arXiv stat.ML / 2026/3/24

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、従来の機械学習(ML)によるコンプライアンス監視手法が、観測データを真値であると誤って仮定していると主張する。これは、規則があらかじめ既知であり、主要な変数が潜在で、かつ部分的にしか観測されない課税のような領域では破綻する。
  • 規制ルールを構造化された事前分布として符号化し、ルールの活性化、コンプライアンス率、パラメトリックなドリフトを捉える潜在のルール・ステート空間に対して事後推論を行う、ベイズ的アプローチであるルール・ステート推論(RSI)を提案する。
  • 著者らは、3つの理論的保証を提示する。すなわち、事前比の補正による規制変更の高速な取り込み、データが蓄積するにつれて成立する事後分布のベルンシュタイン=フォン・ミーゼス整合性、そして平均場変分推論におけるELBOの単調改善である。
  • RSIは、トーゴの財政システムの具体化に対して評価される。新しいベンチマーク(RSI-Togo-Fiscal-Synthetic v1.0)が構築され、実際のOTRルール(2022〜2025)から作成される。ラベル付き学習データなしでの性能として、F1=0.519およびAUC=0.599が示される。
  • このフレームワークは実行時間において大きな優位性を示し、規制変更の取り込みが、全面的な再学習(683〜1082ms)と比べて1ms未満で行える。少なくとも約600倍の高速化であることが報告されている。

概要: コンプライアンス監視のための既存の機械学習フレームワーク――マルコフ論理ネットワーク、確率的ソフト論理、教師ありモデル――はいずれも根本的なパラダイムを共有している。それらは、観測データを真の事実(ground truth)として扱い、そこから規則を近似しようとするという前提に立っている。しかし、この前提は、課税や規制コンプライアンスのように規則によって統治される領域では破綻する。そこでは、権威ある規則が事前に既知であり、本当の難しさは、部分的でノイズのある観測から、規則の活性化、コンプライアンス、そしてパラメータのドリフトに関する潜在状態を推論することにある。
我々は、Rule-State Inference(RSI)を提案する。これは、規制の規則を構造化された事前分布としてエンコードし、コンプライアンス監視を、潜在する規則状態空間 S = {(a_i, c_i, delta_i)} 上での事後推論として捉えることで、このパラダイムを反転させるベイズ的枠組みである。ここで a_i は規則の活性化を表し、c_i はコンプライアンス率をモデル化し、delta_i はパラメータのドリフトを定量化する。さらに、次の3つの理論的保証を証明する。(T1) RSI は、事前分布の比率補正によりデータセットサイズに依存せず O(1) 時間で規制の変更を吸収する。(T2) 事後分布は Bernstein-von Mises に整合的であり、観測が蓄積されるにつれて真の規則状態へ収束する。(T3) mean-field の変分推論は、Evidence Lower BOund(ELBO)を単調に最大化する。
RSI をトーゴの財政システムに適用し、RSI-Togo-Fiscal-Synthetic v1.0 を導入する。これは、実際の OTR 規制ルール(2022-2025)に基づく 2,000 の合成企業からなるベンチマークである。ラベル付きの学習データを一切用いずに、RSI は F1=0.519、AUC=0.599 を達成し、規制の変更を 1ms 未満で吸収する。これは、完全なモデル再学習に対して 683-1082ms であることと比べて、少なくとも 600倍の高速化に相当する。