Abstract
デジタル書籍の間もなく始まる大規模化を考えると、グラフィカルなパターンによってコレクションを検索できるようにすることが重要になってきています。歴史的文書における現在の文書検索およびパターン検出の戦略は、なお改善の余地があります。最先端の戦略は、パターン検出において全体の精度0.494 を達成している一方で、小さな非正方形クエリに対する精度は 0.427 に留まっています。さらに、処理時間が過大であり、SOTA モデルが用いる密度ベースの戦略のため DocExplore データセットでの検索に最大 7 秒を要します。そこで本研究では、より優れたエンコーダ(iDoc)に基づき、自己教師ありの戦略で学習させた新しいモデルと、検索を加速するためのオープンセット検出器を提案します。本モデルは、最先端のパターン検出および文書検索に匹敵する結果を達成し、速度を 10 倍向上させます。さらに、本モデルは小さな非正方形クエリにおいて新しい SOTA 性能に到達し、新たな精度 0.612 を実現します。従来版とは異なり、本手法では誤検出を減らすために非最大抑制を活用します。



