要旨: 頭部性は統語解析における組織化の手段として広く用いられているが、構成素木データセットはそれを明示的にエンコードすることは稀であり、ほとんどの処理パイプラインはペコレーション規則を介して手続き的にそれを再取得する。私たちはこの構成素の頭部性の概念を明示的な表現レイヤとして扱い、整列した構成素と依存アノテーションに対する監視付き予測タスクとして学習し、各構成素の頭を依存関係スパンの頭として定義することによって監督を誘導する。整列した英語と中国語データに対して、得られたモデルは内部的な精度がほぼ天井に達し、Collins式の規則ベースのパーコレーションを大幅に上回る。予測された頭は、頭部駆動の二値化の下でパース精度と同等の結果を生み、誘導された二値トレーニングターゲットが頭の選択に大きく依存せずほぼ同等であることと整合しており、決定論的な構成素から依存関係への変換の忠実度を高め、単純なラベルマッピングインターフェースの下でリソース間および言語間へ移行させる。
構成要素のヘッド性の学習
arXiv cs.CL / 2026/3/17
📰 ニュースModels & Research
要点
- 本論文は構成要素のヘッド性を明示的な表現層として扱い、整列した構成要素と依存注釈を基づく教師付き予測タスクとしてそれを学習する。
- 従来のパーコレーション規則を避け、各構成要素のヘッドを依存関係スパンのヘッドとして定義することで監督を導入する。
- 整列した英語と中国語データにおいて、モデルは内部精度がほぼ天井に近い水準に達し、Collins式のルールベースのパーコレーションを大幅に上回る。
- 予測されたヘッドは、ヘッド駆動の二値化の下で同等の構文解析精度を示し、単純なラベルマッピング・インタフェースを介したリソース間および言語間転送により、構成要素から依存への変換をより忠実に実現する。


