【新しいアイデア】人工三部知能:バイオに着想を得た、センサー優先のアーキテクチャによるフィジカルAI

arXiv cs.AI / 2026/4/16

📰 ニュース

要点

  • 本論文は、身体性のある/フィジカルAIのためのバイオに着想を得たセンサー優先のシステムアーキテクチャ「Artificial Tripartite Intelligence(ATI)」を提案し、信号の取得方法と推論の実行方法を同時に設計(co-design)する。
  • ATIは、相互に作用する3つのサブシステムから構成される:反射的な安全性と信号の完全性制御を担う「Brainstem(L1)」、継続的なセンサー校正を担う「Cerebellum(L2)」、そして技能の選択・実行・協調、さらに深い推論を担う「Cerebral Inference層(L3/L4)」である。
  • このアーキテクチャは、時間に制約のあるセンシング/制御をオンデバイスで行い、高度な推論(エッジ/クラウド)を必要なときだけ呼び出すことで、フィジカルAIの制約(レイテンシ、消費エネルギー、プライバシー、信頼性)に対応することを目標としている。
  • 動的な照明条件と移動を伴う状況におけるモバイルカメラのプロトタイプにより、ATIは、自動露出のデフォルト基準と比較してエンドツーエンド精度を53.8%から88%へ向上させるとともに、リモートL4推論呼び出しを43.3%削減することを示した。
  • 著者らは、この結果が、モデルサイズを単に大きくすることのみに依存するのではなく、ロボットやウェアラブルにおける閉ループの「適応的センシング+推論」の共進化の価値を示していると主張している。

要旨: AIがデータセンターからロボットやウェアラブルへと移るにつれ、ますます大規模化したモデルをスケールするだけでは不十分になってきています。物理AIは厳しいレイテンシ、エネルギー、プライバシー、信頼性の制約のもとで動作しており、その性能はモデルの容量だけでなく、動的な環境において制御可能なセンサーを通じてどのように信号を取得するかにも依存します。私たちは、バイオに着想を得た「センサー第一」の物理AI向けアーキテクチャ契約であるArtificial Tripartite Intelligence (ATI) を提案します。ATIはシステムレベルで三分割されています。すなわち、Brainstem(L1)が反射的な安全性と信号の完全性の制御を担い、Cerebellum(L2)が連続的なセンサー校正を行い、Cerebral Inference Subsystem(L3/L4にまたがる)が日常的なスキル選択と実行、協調、そして深い推論を支えます。このモジュール化された構成により、センサー制御、適応的センシング、エッジ—クラウド実行、基盤モデル推論が、1つの閉ループ・アーキテクチャの中で共進化できる一方で、時間にクリティカルなセンシングと制御はデバイス上で維持し、高次の推論は必要なときにのみ呼び出します。動的な照明と動きのもとで、モバイルカメラのプロトタイプにATIを実装します。ルーティングされた評価(L3-L4分割推論)では、デフォルトのオートエクスポージャ設定と比べて、ATI(L1/L2の適応的センシング)がエンドツーエンド精度を53.8%から88%へ改善しつつ、リモートL4呼び出しを43.3%削減します。これらの結果は、具現化(embodied)AIにおいてセンシングと推論を共同設計することの価値を示しています。