要旨: 我々は、EU AI Actのコンプライアンス分類のための神経記号推論システムにおいて、論理積(conjunction)メカニズムとして3つのtノルム演算子――ルカシェーヴィチ(T_L)、積(T_P)、ゲーデル(T_G)――を比較する最初のパイロット研究を提示する。LGGT+(Logic-Guided Graph Transformers Plus)エンジンと、4つのリスク区分(禁止、high_risk、limited_risk、minimal_risk)にまたがる1035件の注釈付きAIシステム記述のベンチマークを用いて、分類精度、誤検知(false positive)率および見逃し(false negative)率、ならびに曖昧なケースにおける演算子挙動を評価する。n=1035において、3つの演算子はいずれも統計的に有意に異なる(McNemar p<0.001)。T_Gは最高の精度(84.5%)と最良の境界域再現率(borderline recall: 85%)を達成するが、min-semanticsによる過剰分類により8件の誤検知(0.8%)を導入する。T_LとT_Pはいずれも誤検知を0に維持し、T_PはT_Lを上回る(81.2% vs. 78.5%)。主要な知見は以下の通りである。(1)演算子の選択は、ルールベースの網羅性に比べて二次的である。(2)T_LとT_Pは誤検知0を維持するが、境界域ケースを見逃す。(3)T_Gのmin-semanticsは、誤検知率0.8%の代償でより高い再現率を実現する。(4)混合セマンティクスの分類器が生産的な次のステップである。我々はLGGT+コアエンジン(201/201テスト通過)とベンチマークデータセット(n=1035)をApache 2.0のもとで公開する。
EU AI Act 適合性分類のための T-norm 演算子:ニューラル・シンボリック推論システムにおけるルカシェヴィチ、積、ゲーデル意味論の実証的比較
arXiv cs.AI / 2026/3/31
💬 オピニオンDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research
要点
- 本論文は、EU AI Act 適合性分類を目的としたニューラル・シンボリック推論システムにおいて、3 つの t-norm 共通(conjunction)演算子(ルカシェヴィチ、積、ゲーデル)の実証的比較を提示する。
- LGGT+ エンジンと、4 つのリスク区分にまたがる 1,035 件の注釈付き AI システム記述からなるベンチマークを用いて、著者らは演算子間に統計的に有意な性能差があることを見出す(McNemar p<0.001)。
- ゲーデル(min 意味論)は全体の最高精度(84.5%)と最良の境界(borderline)リコール(85%)を達成するが、過度な分類(over-classification)により小さな偽陽性率を追加する(偽陽性 8 件、0.8%)。
- ルカシェヴィチと積は、このパイロットでは偽陽性が 0 件である。さらに、積はルカシェヴィチを上回る(81.2% 対 78.5%)一方で、境界ケースを見逃す傾向がある。
- 本研究は、演算子の選択よりもルールベースの完全性がより重要であると結論づけ、次の生産的なステップとして混合意味論(mixed-semantics)を提案している。また、LGGT+ コアエンジンとベンチマークを Apache 2.0 の下で公開する。



