日本の建築許可申請書類レビューのためのハイブリッド・マルチフェーズ・ページ照合とマルチレイヤー差分検出

arXiv cs.CL / 2026/4/23

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

要点

  • 本論文は、順序やページ番号、内容が大きく変わり得る建築許可申請書類の改訂サイクル間で、PDFページ同士を自動的に対応付けるためのハイブリッドなマルチフェーズページ照合手法を提案する。
  • LCS(最長共通部分列)に基づく構造アラインメント、7段階のコンセンサス照合パイプライン、さらに動的計画法による最適アラインメント段階を組み合わせ、改訂間での頑健なページ対応を実現する。
  • テキストレベル、表レベル、ピクセルレベルの視覚差分を用いたマルチレイヤー差分エンジンにより、差分をハイライトしたレポートを生成する。
  • 実在の許可申請書類で評価した結果、手作業で注釈したベンチマークに対しF1=0.80、精度=1.00、誤ったマッチ(偽陽性の対応)は0件という性能が報告されている。
  • 日本の建築許可審査における、手作業の突合と照合作業の負担・誤りを減らすことを目的としている。

概要: 日本の建築許可(建築確認)申請書類セットの自動比較のためのハイブリッド多段階ページマッチングアルゴリズムを提案します。日本における建築許可の審査では、改訂サイクルをまたいで大規模なPDF文書セットを相互参照する必要があり、この作業は手作業で行うと、労力が大きく、かつ誤りが起きやすくなります。本アルゴリズムは、最長共通部分列(LCS)の構造的アラインメント、7段階のコンセンサスマッチング・パイプライン、そして動的計画法による最適アラインメント段階を組み合わせることで、ページの順序、ページ番号、または内容が大幅に変化しても、改訂間でページを堅牢に対応付けます。続いて、テキストレベル、表レベル、ピクセルレベルの視覚差分を含む多層ディフ(差分)エンジンにより、強調表示された差分レポートを生成します。実世界の許可文書セットでの評価では、手作業で注釈を付けたグラウンドトゥルースのベンチマークに対してF1=0.80、precision=1.00を達成し、誤った対応(false-positive)のマッチングペアはゼロでした。