AutoFormBench: 自動フォーム理解のためのベンチマークデータセット
arXiv cs.CV / 2026/4/1
💬 オピニオンSignals & Early TrendsModels & Research
要点
- AutoFormBenchは、政府・医療・企業の実在フォーム計407件を対象に、チェックボックスや入力欄、テキストボックス等の「記入可能要素」を注釈したベンチマークデータセットを提案している。
- フォームのレイアウト変動が大きい現実環境でも要素検出とクラス分類を学習・評価できることを目的としている。
- 比較実験では、従来のOpenCV手法に加えてYOLO系4モデル(YOLOv8, YOLOv11, YOLOv26-s, YOLOv26-l)でPDF上の要素ローカライズ/分類を評価している。
- 結果として、YOLOv11が全要素クラスおよび許容範囲(tolerance level)においてF1スコアとJaccard accuracyの両面で一貫して最良だったとしている。




