長期ニューロ-シンボリック記憶によるマルチモーダルエージェント推論の高度化

arXiv cs.AI / 2026/3/17

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

NS-Mem は、ニューラルメモリと明示的なシンボリック構造とルールを統合することで、マルチモーダルエージェント推論を高度化する長期ニューロ-シンボリック記憶フレームワークである。
本システムは、エピソード記憶層、意味記憶層、論理ルール層の三層メモリアーキテクチャを採用し、構造化知識の自動構築と維持、および SK-Gen を用いたニューラル表現とシンボリックルールの段階的更新を実現する。
ハイブリッドなメモリ検索機構は、類似度ベース検索と決定論的なシンボリック照会機能を組み合わせ、構造化推論を支援する。
実世界のマルチモーダル推論ベンチマークでの実験では、NS-Mem が純粋なニューラルメモリシステムに比べて全体的な推論精度を平均4.35%改善し、制約付き推論クエリでは最大で12.5%の向上を達成した。

要旨: 大規模言語モデルの最近の進歩は、オープンワールドでマルチモーダルな環境で動作するインテリジェントエージェントの出現を促しています。長期的な推論を支えるために、この種のエージェントは通常、外部メモリシステムを備えています。しかし、既存の多模態エージェントのメモリの多くは主にニューラル表現とベクトルベースの検索に依存しており、帰納的で直感的な推論には適していますが、現実世界の意思決定に不可欠な分析的・演繹的推論をサポートする点で根本的に制限されています。この制限に対処するために、NS-Mem は、ニューラルメモリを明示的な記号構造と規則と統合することで、マルチモーダルエージェントの推論を前進させる長期的なニューラル・シンボリック記憶フレームワーク NS-Mem を提案します。具体的には、NS-Mem はメモリシステムの三つのコアコンポーネントを中心に運用されます: (1) エピソード層、セマンティック層、論理規則層から成る三層メモリアーキテクチャ、(2) SK-Gen によって実装されたメモリ構築・保守メカニズムが、蓄積されたマルチモーダル体験から構造化された知識を自動的に統合し、ニューラル表現と記号規則の両方を段階的に更新します、(3) 類似性ベースの検索と決定論的な記号クエリ機能を組み合わせて構造化推論を支援するハイブリッドメモリ検索機構。実世界のマルチモーダル推論ベンチマークでの実験は、ニューラル・シンボリック・メモリが純粋なニューラルメモリシステムに対して平均4.35%の全体的な推論精度の改善を達成し、制約された推論クエリでは最大12.5%の改善をもたらすことを示し、NS-Mem の有効性を裏付けています。

VoxtralResearchVoxtral TTSについて：高速で、即座に適応可能で、音声エージェント向けに臨場感のある発話を生成する最前線のオープンウェイト音声合成モデル

Mistral AI Blog

2026年にMiMo V2 APIを無料で使う方法：完全ガイド

Dev.to

誰も解けないエージェントのメモリ問題：永続的なコンテキストのための実践的アーキテクチャ

Dev.to

カオスからコンプライアンスへ：モバイル・キッチンのためのAIオートメーション

Dev.to

AIにおけるMCPを解説（実例付き）

Dev.to

長期ニューロ-シンボリック記憶によるマルチモーダルエージェント推論の高度化

要点

関連記事

VoxtralResearchVoxtral TTSについて：高速で、即座に適応可能で、音声エージェント向けに臨場感のある発話を生成する最前線のオープンウェイト音声合成モデル

2026年にMiMo V2 APIを無料で使う方法：完全ガイド

誰も解けないエージェントのメモリ問題：永続的なコンテキストのための実践的アーキテクチャ

カオスからコンプライアンスへ：モバイル・キッチンのためのAIオートメーション

AIにおけるMCPを解説（実例付き）

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer