概要: 非定型の発話は音声技術研究においてより大きな注目を集めていますが、この分野の多くの取り組みは、学際的な対話が十分に行われないまま進められています。特に吃音のある発話については、現在の音声認識システムが実際の場面では不十分であること、また、現在の評価方法や研究の優先事項が、エンドユーザーの経験やニーズに体系的に根ざしていないことが広く認識されています。本研究では、これらのギャップを1) 吃音のある発話を扱う論文を対象にしたスコーピングレビューと、2) 吃音のある成人および言語聴覚士を含む70名の利害関係者を対象とした調査、という2つの観点から分析します。これら2つの視点を分析することで、吃音のある発話に関する研究のタクソノミーを提案し、現在の研究の方向性が利害関係者によって示されたニーズからどこで分岐しているのかを特定し、さらに吃音者コミュニティの真のニーズに取り組むための具体的なガイドラインと方向性を示すことで結論づけます。
吃音の音声研究をエンドユーザーのニーズに整合させる:スコーピングレビュー、調査、ガイドライン
arXiv cs.CL / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- 本研究は、吃音(stuttered speech)の研究がエンドユーザーの実際のニーズと十分にかみ合っておらず、その結果として優先度や評価方法にズレが生じていると主張している。
- スコーピングレビュー(吃音に関する論文の調査)と、吃音のある成人および言語聴覚士を含む70名のステークホルダー調査を組み合わせてギャップを明らかにする。
- 得られた知見をもとに、吃音音声研究のタクソノミー(分類体系)を提案し、現在の研究の方向性がステークホルダーの要望からどこで乖離しているかを特定する。
- その上で、吃音コミュニティのニーズにより確実に応えるための具体的なガイドラインと今後の研究方向性を提示している。




