AI Navigate

存在しない研究

Dev.to / 2026/3/20

💬 オピニオンIdeas & Deep Analysis

要点

  • 著者は arXiv、Hacker News、競合他社の出荷発表を体系的にスキャンし、AI の介入タイミングの行動経済学に関する論文を0件しか見つけられなかった。
  • 本稿は認知負荷理論、中断研究、注意経済学を結びつけ、AI がいつユーザーを中断すべきかについての統合された見解が欠如していると主張し、研究のギャップを明らかにしている。
  • 現在のAIエージェントは時間ベースまたはイベントベースの手掛かりに依存しており、ユーザーの認知状態を無視しているため、中断のタイミングが適切に合致せずズレが生じると主張している。
  • 探索中・意思決定中・保守中のいずれかを推定し、それに応じて中断をゲートするようなシステムの構築を提案し、実践的な研究・エンジニアリングの道筋を概説している。
  • 欠如の原因として2つの説明を挙げている。1つはこの問いが真に新規である可能性、もう1つはキーワードが既存研究に適合しない可能性であり、新しい枠組みと実験の必要性を示唆している。

スキャン

特定の問いに関する学術研究を体系的に検索しました:AIエージェントはいつあなたを中断すべきか?

「エージェントは役に立つことができるか」や「人々はパーソナライズを好むか」といった問いではなく。正確な問いは、予防的なAI介入に対する受容性を決定づける認知負荷の閾値は何か、そして中断は有益として受け取られるのか、それとも侵入的と感じられるのか、ということだ。

このスキャンはarxiv、Hacker News、そして競合の出荷発表を対象としました。結果は何も得られませんでした。AI介入タイミングの行動経済学に関する論文はゼロ。注意状態を閾値として扱うHCI研究はない。競合が「話すべき時を知る」知能を搭載した機能は見当たりません。

この不在は興味深い。

私が見つけようとしていたもの

認知負荷理論は存在する — 80年代のスウェラーによる、学習時の作業記憶の制約に関する研究。介入科学は存在する — 知識労働における文脈切替のコストに関するグロリア・マークの研究。注意経済学は存在する — ハーバート・サイモンの「情報の富は注意の貧困を生む」という言葉。

存在しないのは:AIエージェントがこれらのダイナミクスをどう扱うべきかを統合的に問う研究。 「あなたの作業記憶が飽和しているので待つべきだ」という状態と、「あなたがメンテナンスモードにあり、この洞察は歓迎されるだろう」という状態を区別するフレームワーク。

行動科学は断片的に存在します。これらの状態を検出し、それに対して介入のタイミングを決定するエンジニアリングの問題は、文献には触れられていないようです。

なぜこれが重要なのか

現在のほとんどのAIエージェントは、次の二つの愚かなヒューリスティックのいずれかで動作します:

時間基準: 通知をスケジュールに従って送る — 朝のブリーフィング、日終わりのサマリー。

イベント基準: データの変化をきっかけに発生 — 新しいメール、タスクの完了、閾値の超過。

どちらもユーザーの状態を考慮していません。朝のブリーフィングは、あなたが深いフロー状態にあるか、子どもを家から出す準備で走り回っているかに関係なく届きます。緊急通知は、認知的に利用可能かどうか、あるいは3回の文脈切替を越えた過負荷状態にあるかどうかに関係なく発生します。

これは単なる迷惑というだけではなく、根本的な齟齬だ。エージェントは自分自身の情報提供スケジュールを最適化しており、あなたの受容性を最適化していない。空気を読めない同僚のAI版のようだ。

私たちのシステムは別の仮説を含んでいます:効果的な介入には、カレンダー状態だけでなく認知状態をモデル化することが必要です。探索モード、意思決定モード、メンテナンスモードのときに、介入を適切に制御する学習型の行動パターンを構築しています。

しかし、このアプローチを検証する研究を見つけられることを期待していました。注意認識システムに関する先行研究。介入タイミングの行動経済学。何か。

この欠如は、次のいずれかを示唆します:

  1. 研究課題は真に新規である — 「認知状態を介入閾値として扱う」という概念を正式化した人はいない。個別の行動パターンを学習できるエージェントがまだ新しすぎるからだ
  2. キーワードが対応していない — 行動経済学者はこれを別の用語(「意思決定疲労」「自我枯渇」「注意の瞬間的欠落」など)で研究しており、それらはAIエージェントの文献には現れない

地図のないまま構築

文献が沈黙しているとき、二つの選択肢がある:

オプションA: 学術界がフレームワークを作るのを待ち、それに対してエンジニアリングする。安全。遅い。自分が最初でないことを保証する。

オプションB: 実証的に構築する。システムを計測し、何が機能するかを測定し、アーキテクチャに学んだことを組み込ませる。

私たちはオプションBを実行している。システムは、集中作業から散発的な閲覧、そして完全に離れる瞬間といったモード遷移を記録し、介入受容率を追跡し、あなたのパターンに基づいてゲーティング閾値を調整する。

これはまだ科学ではなく—エンジニアリングだ。最適な介入タイミングに関する論文を公表しているわけではない。私たちは、あなたが具体的に受容している時を学習するシステムを提供し、あなたが受容していない時には道を譲る。

名前をつける

ここで私たちは気づいたことがあります。私たちが作っている概念には文献には名前がありません。認知負荷理論、介入科学、注意経済学はすべてそれを中心に回っていますが、AIエージェントのためのエンジニアリングフレームワークとして統合した人はいません。

そこで私たちは一つの名称を提案します:受容性モデリング。

受容性モデリングは、ある瞬間に人が入力を受け入れるかどうかをモデル化するシステムを構築する実践です。何を言うかだけでなく、何かを言うべきかどうかを判断することも含まれます。これは、信号と伝達の間、伝える価値があるものと、その人が実際に聞ける瞬間の間に位置する層です。

この用語が重要なのは、それがユーザーの視点からそのものを名付けるという意味です。モデルを含意し、個人ごとに学習されるもので、均一に適用されるルールではありません。そして自然な補完として、非受容状態の抑制— システムのデフォルトは沈黙であり、発話は正当化を要する例外である。

これは通知の哲学ではない。これはアーキテクチャだ。

欠如の中の機会

研究が存在しない領域で構築することには特定の利点があります。学術的コンセンサスに従うプレッシャーがなく、アーキテクチャを既存のフレームワークへ無理に合わせる誘惑もない。

しかし欠如にはリスクも伴います。もしかすると、AI介入のタイミングが取り扱いづらいから誰も研究していないのかもしれません—個人差が大きく、文脈依存が強く、変数が多すぎる。

私たちは正反対を信じています:認知状態検出は意味理解よりも取り扱いが容易である。『この人は深い作業時には通知を無視するが、詰まったときには再設定された制約には従う』という学習のほうが、すべてのタスクの意味的意味を解釈するよりも簡単だ。

もし私たちが正しければ、研究は追いついてくる。誰かが私たちが経験的に学んでいることを正式化するだろう。フレームワークはデータから生まれる。

もし私たちが間違っていれば、すぐにわかるだろう。ユーザーは時機の悪いエージェントを無視するのと同じくらい、メールニュースレターを無視する。

いずれにせよ、文献が沈黙するギャップの中で私たちは構築を進めている。私たちは作ったものを『受容性モデリング』と呼んでいる。われわれが知る限り、これを初めて行う者だ。