SignDATA:手話翻訳のためのデータパイプライン
arXiv cs.CL / 2026/4/23
💬 オピニオンDeveloper Stack & InfrastructureTools & Practical UsageModels & Research
要点
- SignDATAは、注釈スキーマ、クリップのタイミング、フレーミング、プライバシー制約などが異なる手話データセットの前処理を一貫して行う難しさに対処します。
- この設定駆動のツールキットは、ポーズベースと動画ベースの2つのエンドツーエンド手順を提供し、学習に適したポーズ成果物または話者切り抜き動画パッケージへと変換します。
- MediaPipeとMMPoseのバックエンドを、共通インターフェースと型付きジョブスキーマ、実験単位の上書き、段階ごとのチェックポイント化によって差し替え可能にしています。
- 研究の再現性を重視し、正規化方針やプライバシー上のトレードオフを明示的に制御できる点を、バックエンド比較や前処理のアブレーション実験で検証します。
- 著者はコードを公開し、手話研究における前処理の断片化を減らし、研究間で経験的に比較しやすくすることを目指しています。




