COTeスコア: 文書レイアウト分析(DLA)モデルを評価するための分解可能なフレームワーク

arXiv cs.CV / 2026/3/16

📰 ニュースIdeas & Deep AnalysisTools & Practical UsageModels & Research

要点

  • 本論文は Structural Semantic Unit(SSU)とCOTeスコアを発表する。COTeスコアは、IoU、F1、mAPといった従来の指標を超えて、文書レイアウト分析を評価するための分解可能な指標である。
  • COTeが意味的構造を捉え、意味的境界の逸脱や同じ領域の繰り返し解析といった明確な故障モードを明らかにし、従来の指標よりも情報量が豊富であることを示している。
  • 著者らは、3つのDLAデータセットにおいてCOTeがF1と比較して解釈と性能のギャップを最大で76%低減することを報告している。
  • 重要なのは、SSUラベリングが明示的に付与されていなくてもCOTeの粒度の頑健性が保たれることで、普及の障壁が低減される。
  • さらに、SSUラベル付きデータセットと、DLAプロジェクトでCOTeを適用するためのPythonライブラリを公開している。