VeriTrans:決定論的ニューラル・シンボリック・パイプラインによる、ファインチューニング済みLLM支援のNL→PL翻訳
arXiv cs.AI / 2026/4/14
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- VeriTrans は、自然言語要件をソルバで実行可能な論理(NL→PL)へ変換しつつ、記号的検証(CNF コンパイル)とバリデータによるゲートで信頼性を高める「reliability-first」パイプラインを提案しています。
- 命令チューニング済みの NL→PL 翻訳に加えて、PL→NL のラウンドトリップ復元を高精度な受理条件として用い、温度=0・固定シード(seed=42)やプロンプト/出力/ハッシュ等の全アーティファクトログで監査と再現性を実現します。
- SatBench の 2,100 仕様に対し 94.46% の SAT/UNSAT 正確性と、87.73% の中央値ラウンドトリップ類似度を報告しています。
- 100〜150 件の厳選例によるコンパクトなファインチューニングで忠実度が 1〜1.5pp 改善し、平均 25.8 秒/仕様(指定した 201 仕様サブセット)で遅延増を抑えたとされています。
- 受理閾値(例: τ=75)により「reliability–coverage」のトレードオフを制御でき、受理された集合で約 94% の正確性を保ちながらおよそ 68% の項目を保持できると示されています。




