筆者は人それぞれ:歴史的アラビア写本のための筆者識別
arXiv cs.LG / 2026/4/27
💬 オピニオンDeveloper Stack & InfrastructureSignals & Early TrendsModels & Research
要点
- この研究は、歴史的なアラビア写本における筆者識別を行い、由来(プロベナンス)や真正性の検証、歴史・言語分析を支援することを目的としています。
- Muharafデータセットを用いて、著者らは公開部分の筆者ラベルを手作業で検証・補完し、不整合なラベルや非手書きテキストを除去するなどデータを整備しました。
- 閉集合(closed-set)の筆者識別のために、注意機構付きのCNNベースモデルを提案し、まれな「二人の筆者による行」は複合の筆者ペアクラスとして扱います。
- 14通りの構成とアブレーション評価の結果、より難しいページ非重複(page-disjoint)プロトコルでは大きく性能が低下し、ページ単位の手がかりの重要性が定量化されました。
- 線ごとの評価とページ非重複評価の両方について初のベースラインを提示し、コードと実装をGitHubで公開することで、歴史家や言語学者の実務に役立てる狙いがあります。




