バーチャル音声療法士：パーソナライズされた監督下の治療のための、臨床家イン・ザ・ループ型AIスピーチ療法エージェント

arXiv cs.AI / 2026/5/5

📰 ニュースDeveloper Stack & InfrastructureTools & Practical UsageModels & Research

共有:

要点

本論文は、Virtual Speech Therapist（VST）というエージェント型プラットフォームを提案し、吃音のアセスメントと個別化された治療計画の作成を自動化しつつ、最終確認を臨床家レビューに委ねます。
VSTは深層学習で患者の発話から吃音のタイプを分類し、その結果をもとにマルチエージェントLLM推論によって治療計画案を作成・批評し、反復的に洗練させます。
専用の「批評（critic）」エージェントが治療案を評価し、臨床的な安全性、方法論的な妥当性、査読済みエビデンスおよび専門家ガイドラインとの整合性を担保します。
専門の言語聴覚士による評価では、VSTが高品質でエビデンスに基づく治療提案を一貫して生成することが報告されており、臨床家イン・ザ・ループの運用でフィードバックを反映したうえで患者提供に至ります。
リアルタイムの吃音評価と個別化治療計画を支えるオンラインの対話型UIも、vocametrix.comで提供されています。

要旨: 本論文は、吃音の評価を効率化し、自動化され適応的なAI駆動ワークフローを通じてカスタマイズされた治療計画を提供する、インテリジェントなエージェントベースのプラットフォーム「Virtual Speech Therapist（VST）」を開発する。本システムは、最先端の深層学習に基づく吃音分類と、多エージェント型の大規模言語モデル（LLM）推論を統合し、エビデンスに基づく臨床的意思決定を支援する。VSTは、まず患者の発話サンプルの取得と特徴抽出を行い、その後、吃音のタイプを堅牢に分類する。これらの出力に基づき、VSTはエージェント的な推論プロセスを開始し、専門化されたLLMエージェントが自律的に個別化された治療計画を生成、批評し、反復的に洗練していく。専用の批評エージェントが、生成されたすべての治療計画を評価し、臨床的安全性、方法論的妥当性、査読済みのエビデンスおよび確立された専門ガイドラインとの整合性を担保する。その結果得られる出力は、臨床家によるレビューを目的とした包括的で患者固有の治療案である。臨床家からのフィードバックを取り入れたのち、システムは患者提供に適した最終化された治療計画を生成し、これにより「臨床家が介在する（clinician-in-the-loop）」パラダイムを維持する。専門の言語聴覚士（speech therapists）による実験的評価により、VSTが一貫して高品質でエビデンスに基づく治療推奨を生成することが確認された。これらの知見は、本システムが臨床ワークフローを補完し、臨床家の負担を軽減し、発話障害のある個人の治療成績を改善する可能性を示している。提案システムのためのインタラクティブなユーザインタフェースはオンラインで利用可能で、以下に示す: https://vocametrix.com/ai/stuttering-therapy-planning-agent 。これにより、リアルタイムの吃音評価と個別化された治療計画が可能になる。