ARC-AGI-2 技術報告書

arXiv cs.CL / 2026/3/10

Ideas & Deep AnalysisModels & Research

要点

  • ARC-AGI-2 システムは、ニューラル推論と構造認識プライヤーおよびオンラインタスク適応を組み合わせることで、Abstraction and Reasoning Corpus (ARC) の性能を向上させます。
  • 改良された LongT5 トランスフォーマーアーキテクチャによって処理されるコンパクトな125トークンのタスクエンコーディングを用いて、ARC 推論をシーケンスモデリング問題として再定式化します。
  • 群対称性、グリッドの走査、およびオートマトンの摂動を通じて不変性を強制する新しいデータ拡張フレームワークにより、推論の仮説空間を広げます。
  • 軽量な LoRA 適応を用いたテスト時トレーニングにより、デモンストレーションから変換ロジックを学習し、未知のタスクに特化します。
  • 対称性を考慮したデコーディングおよびスコアリング機構が拡張されたタスクビューからの尤度を集約し、多視点推論を実現。これにより、以前のニューラル ARC ソルバーを超える性能を達成し、人間レベルの一般化に迫ります。

計算機科学 > 計算と言語

arXiv:2603.06590(cs)
[2026年2月4日投稿]

題目:ARC-AGI-2 Technical Report

Wallyson Lemes de Oliveira および他12名の著者による論文「ARC-AGI-2 Technical Report」のPDFを表示
PDFを表示 HTML(実験的)
要旨:抽象化と推論コーパス(ARC)は、単なるパターン照合を超えた汎化を評価するために設計されており、非常に少ない例から記号的ルールを推論することが要求されます。本研究では、ニューラル推論と、構造を考慮した事前(プリオル)およびオンライン課題適応を組み合わせることでARCの性能を向上させる、トランスフォーマーに基づくシステムを提示します。提案手法は4つの主要なアイデアに基づいています。第一に、ARCの推論を、125トークンだけのコンパクトなタスク符号化を用いて、系列モデリング問題として再定式化します。これにより、改良したLongT5アーキテクチャで効率的な長文脈処理を可能にします。第二に、グループ対称性、グリッドのトラバース(走査)、オートマトンの摂動に基づく、原理に立脚したデータ拡張フレームワークを導入し、表現の変化に対する不変性を強制します。第三に、軽量なLoRA適応を用いたテスト時学習(TTT)を適用し、デモンストレーションからその変換ロジックを学習することで、未見の各タスクにモデルを特化させます。第四に、対称性を考慮したデコードおよびスコアリングのパイプラインを設計し、拡張されたタスクの見え方ごとの尤度を集約します。これにより、候補解に対して実質的に「複数の視点による推論」を行います。これらの構成要素は相乗的に働くことを示します。拡張は仮説空間を広げ、TTTは局所的な推論を鋭くし、対称性に基づくスコアリングは解の一貫性を改善します。最終的なシステムは、トランスフォーマーのベースラインに対して大幅な改善を達成し、これまでのニューラルARCソルバを上回ります。人間レベルの汎化に向けたギャップを埋めることに近づきます。
コメント:
分野: 計算と言語(cs.CL); 人工知能(cs.AI)
引用: arXiv:2603.06590 [cs.CL]
  (このバージョンの場合は arXiv:2603.06590v1 [cs.CL]
  https://doi.org/10.48550/arXiv.2603.06590
さらに詳しく知るにはここにフォーカス
DataCite 経由で発行された arXiv の DOI

投稿履歴

作成者: Matteo Caorsi [メールを表示]
[v1] 2026年2月4日 水 10:03:56 UTC(11,173 KB)
フルテキストリンク:

論文へのアクセス:

現在の閲覧コンテキスト:
cs.CL
< prev   |   next >
次の閲覧へ切り替え:

参照 & 引用

BibTeX 引用をエクスポート 読み込み中...

BibTeX 形式の引用

×
提供元:

ブックマーク

BibSonomyロゴ Redditロゴ
書誌ツール

書誌および引用ツール

Bibliographic Explorer トグル
Bibliographic Explorer (エクスプローラーとは?)
Connected Papers トグル
Connected Papers (Connected Papers とは?)
Litmaps トグル
Litmaps (Litmaps とは?)
scite.ai トグル
scite Smart Citations (スマート引用とは?)
コード、データ、メディア

この記事に関連するコード、データ、メディア

alphaXiv トグル
alphaXiv (alphaXiv とは?)
コードへのリンク トグル
CatalyzeX 論文向けコードファインダー (CatalyzeX とは?)
DagsHub トグル
DagsHub (DagsHub とは?)
GotitPub トグル
Gotit.pub (GotitPub とは?)
Huggingface トグル
Hugging Face (Huggingface とは?)
コードへのリンク トグル
Papers with Code (Papers with Code とは?)
ScienceCast トグル
ScienceCast (ScienceCast とは?)
デモ

デモ

Replicate トグル
Replicate (Replicate とは?)
Spaces トグル
Hugging Face Spaces (Spaces とは?)
Spaces トグル
TXYZ.AI (TXYZ.AI とは?)
関連論文

推薦システムと検索ツール

Influence Flower へのリンク
Influence Flower (Influence Flower とは?)
Core 推薦トグル
CORE Recommender (COREとは?)
arXivLabsについて

arXivLabs:コミュニティの協力者と取り組む実験的プロジェクト

arXivLabsは、協力者が当サイト上で新しいarXivの機能を直接開発し、共有できるようにするためのフレームワークです。

arXivLabsに取り組む個人および組織は、オープン性、コミュニティ、卓越性、利用者データのプライバシーという価値観を受け入れ、それを重視してきました。arXivはこれらの価値観にコミットしており、それらを遵守するパートナーとのみ協業します。

arXivのコミュニティに価値をもたらすプロジェクトのアイデアはありますか? arXivLabsの詳細を読む