モジュラー型ニューラルコンピュータ

arXiv cs.LG / 2026/3/17

📰 ニュースModels & Research

共有:

要点

本論文は、入力長が異なるデータに対して厳密なアルゴリズム計算を可能にする、外部の連想メモリと明示的な読み出し/書き込みヘッド、コントローラとしての MLP、そして同質のモジュラー神経部品の集合を組み合わせた、メモリ拡張型ニューラルアーキテクチャであるモジュラー型ニューラルコンピュータ（MNC）を紹介する。
MNC は外部の連想メモリと明示的な読み出し/書き込みヘッド、コントローラ MLP、そして同質のモジュラー神経部品の集合を組み合わせ、決定論的でプログラム可能な挙動を実現する。
データからエンドツーエンドでアルゴリズムを学習するのではなく、MNC は固定インタフェースと厳密な挙動を備えた解析的に指定されたニューラル部品を用いてアルゴリズムを実現し、計算の流れを制御するためにワンホットモジュールゲートを使用する。
このアーキテクチャは、3つのケーススタディ（配列の最小値の取得、インプレースソート、固定インスタンスに対する A* 探索）を通じて示され、決定論的な状態の推移と明示的な中間結果を明らかにする。

要旨: 本論文は、変長入力に対する正確なアルゴリズム計算のためのメモリ拡張ニューラルアーキテクチャであるモジュラー型ニューラルコンピュータ（MNC）を紹介します。モデルは、スカラーセルの外部連想メモリ、明示的な読み出しヘッドと書き込みヘッド、コントローラ多層パーセプトロン（MLP）、および同質の機能MLPモジュールの集合を組み合わせます。データからエンドツーエンドでアルゴリズムを学習するのではなく、固定インターフェースと正確な挙動を備えた解析的に指定されたニューラルコンポーネントを通じて、特定のアルゴリズムを実現します。制御フローは、ニューラル計算内部にワンホットモジュールゲートによって表現され、非活性モジュールは抑制されます。計算は、固定グラフによって生成されるメモリ変換のシーケンスとして展開します。本アーキテクチャは、3つのケーススタディを通じて説明されます。配列の最小値の計算、配列をその場でソート、固定の問題インスタンスに対するA*探索の実行。これらの例は、アルゴリズム的手順を外部メモリを持つモジュール型ニューラルコンポーネントにコンパイルしつつ、決定論的な挙動と明示的な中間状態を保持できることを示しています。

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

THE DECODER

Kreuzberg v4.5.0: Doclingのモデルをとても気に入ったので、より高速なエンジンを搭載しました

Reddit r/LocalLLaMA

今日は、qwen 120B のような比較的大きめのローカルモデルを動かすには、どんなハードウェアを用意すべきか？

Reddit r/LocalLLaMA

会議ノート作成のためにMistralをローカルで実行することは、私の用途には正直十分だ

Reddit r/LocalLLaMA

[D] 5つの年代にわたる単一アーティストの長期的ファインアートデータセットがHugging Faceに公開 — スタイルの進化、人物表現、倫理的トレーニングデータの潜在的応用

Reddit r/MachineLearning

モジュラー型ニューラルコンピュータ

要点

関連記事

数学には思考の時間が、日常知識には記憶が必要であり、新しいTransformerアーキテクチャは両方を実現することを目指す

Kreuzberg v4.5.0: Doclingのモデルをとても気に入ったので、より高速なエンジンを搭載しました

今日は、qwen 120B のような比較的大きめのローカルモデルを動かすには、どんなハードウェアを用意すべきか？

会議ノート作成のためにMistralをローカルで実行することは、私の用途には正直十分だ

[D] 5つの年代にわたる単一アーティストの長期的ファインアートデータセットがHugging Faceに公開 — スタイルの進化、人物表現、倫理的トレーニングデータの潜在的応用

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer