要約:大規模言語モデル(LLMs)は流暢なテキスト生成において顕著な進歩を遂げているが、長期的かつ動的な対話における文脈のずれという重大な課題に直面している。人間のユーザーが前提を省略したり、参照を簡略化したり、LLMsとの対話中に文脈を急激に移行させたりした場合、モデルは彼らの実際の意図を捉えきれず、機械的または的外れな応答を生み出し、対話の協働可能性を弱める。この問題に対処するため、本論はContext Alignment Pre-processor(C.A.P.)と呼ばれる計算フレームワークを提案する。生成時に動作するのではなく、C.A.P.はユーザー入力と応答生成の間の前処理モジュールとして機能する。このフレームワークには3つの核心的なプロセスが含まれる:(1)セマンティック拡張、これにより前提・文字義・含意を含むより広い意味域へユーザー指示を拡張する;(2)時間重み付き文脈取得、これは人間の会話の焦点を近似する時間減衰関数を用いて最近の対話履歴を優先する;(3)アラインメント検証と意思決定分岐、現在のプロンプトと重み付けされた過去の文脈との意味的類似性を測定して対話が軌道上にあるかを評価する。重大な逸脱が検出されると、C.A.P.はユーザーとシステムが会話を再調整するのを助ける構造化された明確化プロトコルを開始する。本研究はC.A.P.のアーキテクチャと理論的基盤を提示し、人間-コンピュータ相互作用における認知科学とCommon Ground理論を踏まえる。我々は、C.A.P.が単なる技術的な洗練だけでなく、一方通行の命令実行パターンから双方向、自己修正型、パートナーシップに基づく協働へと人間-コンピュータ対話を転換する一歩であると主張する。最後に、実装パス、評価方法、そして対話型知能システムの将来設計に対する示唆について論じる。
返却形式: {"translated": "翻訳されたHTML"}