ARC-AGI-2 技術報告書

arXiv cs.CL / 2026/3/10

Ideas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

ARC-AGI-2 システムは、ニューラル推論と構造認識プライヤーおよびオンラインタスク適応を組み合わせることで、Abstraction and Reasoning Corpus (ARC) の性能を向上させます。
改良された LongT5 トランスフォーマーアーキテクチャによって処理されるコンパクトな125トークンのタスクエンコーディングを用いて、ARC 推論をシーケンスモデリング問題として再定式化します。
群対称性、グリッドの走査、およびオートマトンの摂動を通じて不変性を強制する新しいデータ拡張フレームワークにより、推論の仮説空間を広げます。
軽量な LoRA 適応を用いたテスト時トレーニングにより、デモンストレーションから変換ロジックを学習し、未知のタスクに特化します。
対称性を考慮したデコーディングおよびスコアリング機構が拡張されたタスクビューからの尤度を集約し、多視点推論を実現。これにより、以前のニューラル ARC ソルバーを超える性能を達成し、人間レベルの一般化に迫ります。

計算機科学 > 計算と言語

arXiv:2603.06590（cs）

[2026年2月4日投稿]

題目:ARC-AGI-2 Technical Report

著者:Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe Carthy

Wallyson Lemes de Oliveira および他12名の著者による論文「ARC-AGI-2 Technical Report」のPDFを表示

PDFを表示 HTML（実験的）

要旨:抽象化と推論コーパス（ARC）は、単なるパターン照合を超えた汎化を評価するために設計されており、非常に少ない例から記号的ルールを推論することが要求されます。本研究では、ニューラル推論と、構造を考慮した事前（プリオル）およびオンライン課題適応を組み合わせることでARCの性能を向上させる、トランスフォーマーに基づくシステムを提示します。提案手法は4つの主要なアイデアに基づいています。第一に、ARCの推論を、125トークンだけのコンパクトなタスク符号化を用いて、系列モデリング問題として再定式化します。これにより、改良したLongT5アーキテクチャで効率的な長文脈処理を可能にします。第二に、グループ対称性、グリッドのトラバース（走査）、オートマトンの摂動に基づく、原理に立脚したデータ拡張フレームワークを導入し、表現の変化に対する不変性を強制します。第三に、軽量なLoRA適応を用いたテスト時学習（TTT）を適用し、デモンストレーションからその変換ロジックを学習することで、未見の各タスクにモデルを特化させます。第四に、対称性を考慮したデコードおよびスコアリングのパイプラインを設計し、拡張されたタスクの見え方ごとの尤度を集約します。これにより、候補解に対して実質的に「複数の視点による推論」を行います。これらの構成要素は相乗的に働くことを示します。拡張は仮説空間を広げ、TTTは局所的な推論を鋭くし、対称性に基づくスコアリングは解の一貫性を改善します。最終的なシステムは、トランスフォーマーのベースラインに対して大幅な改善を達成し、これまでのニューラルARCソルバを上回ります。人間レベルの汎化に向けたギャップを埋めることに近づきます。

コメント:
分野:	計算と言語（cs.CL）; 人工知能（cs.AI）
引用:	arXiv:2603.06590 [cs.CL]
	（このバージョンの場合は arXiv:2603.06590v1 [cs.CL] ）
	https://doi.org/10.48550/arXiv.2603.06590 さらに詳しく知るにはここにフォーカス DataCite 経由で発行された arXiv の DOI

投稿履歴

作成者: Matteo Caorsi [メールを表示]
[v1] 2026年2月4日水 10:03:56 UTC（11,173 KB）

フルテキストリンク:

論文へのアクセス:

Wallyson Lemes de Oliveira および他12名の著者による論文「ARC-AGI-2 Technical Report」のPDFを表示

PDFを表示
HTML（実験的）
TeX ソース

ライセンスを表示

現在の閲覧コンテキスト:

cs.CL

< prev | next >

新着 | 最近 | 2026-03

次の閲覧へ切り替え:

cs
cs.AI

参照 & 引用

NASA ADS
Google Scholar
Semantic Scholar

BibTeX 引用をエクスポート読み込み中...

BibTeX 形式の引用

提供元:

ブックマーク

書誌ツール

書誌および引用ツール

Bibliographic Explorer トグル

Bibliographic Explorer (エクスプローラーとは？)

Connected Papers トグル

Connected Papers (Connected Papers とは？)

Litmaps トグル

Litmaps (Litmaps とは？)

scite.ai トグル

scite Smart Citations (スマート引用とは？)

コード、データ、メディア

この記事に関連するコード、データ、メディア

alphaXiv トグル

alphaXiv (alphaXiv とは？)

コードへのリンクトグル

CatalyzeX 論文向けコードファインダー (CatalyzeX とは？)

DagsHub トグル

DagsHub (DagsHub とは？)

GotitPub トグル

Gotit.pub (GotitPub とは？)

Huggingface トグル

Hugging Face (Huggingface とは？)

コードへのリンクトグル

Papers with Code (Papers with Code とは？)

ScienceCast トグル

ScienceCast (ScienceCast とは？)

デモ

Replicate トグル

Replicate (Replicate とは？)

Spaces トグル

Hugging Face Spaces (Spaces とは？)

Spaces トグル

TXYZ.AI (TXYZ.AI とは？)

arXivLabs：コミュニティの協力者と取り組む実験的プロジェクト

arXivLabsは、協力者が当サイト上で新しいarXivの機能を直接開発し、共有できるようにするためのフレームワークです。

arXivLabsに取り組む個人および組織は、オープン性、コミュニティ、卓越性、利用者データのプライバシーという価値観を受け入れ、それを重視してきました。arXivはこれらの価値観にコミットしており、それらを遵守するパートナーとのみ協業します。

arXivのコミュニティに価値をもたらすプロジェクトのアイデアはありますか？ arXivLabsの詳細を読む。

この論文のどの著者が支持者ですか？ | MathJaxを無効にする (MathJaxとは？)

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

Reddit r/MachineLearning

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

Dev.to

奥を見せる：深度認識インペインティングで「ゴーストマネキン」効果を自動化する

Dev.to

月額20ドルのAIサブスクは新興国の開発者を「ガスライティング」している

Dev.to

低トラストのMCPサーバー呼び出し前に警告する「Claude Code」フック

Dev.to

ARC-AGI-2 技術報告書

要点

計算機科学 > 計算と言語

題目:ARC-AGI-2 Technical Report

投稿履歴

論文へのアクセス:

参照 & 引用

BibTeX 形式の引用

ブックマーク

書誌および引用ツール

この記事に関連するコード、データ、メディア

デモ

推薦システムと検索ツール

arXivLabs：コミュニティの協力者と取り組む実験的プロジェクト

関連記事

オープン・ウェイト・モデル完全ガイド：オープンソースLLMの実務者向け手引き（2026年版）

「Mythos vs GPT-5.4-Cyber」の議論がベンチマークを欠いている理由

奥を見せる：深度認識インペインティングで「ゴーストマネキン」効果を自動化する

月額20ドルのAIサブスクは新興国の開発者を「ガスライティング」している

低トラストのMCPサーバー呼び出し前に警告する「Claude Code」フック

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer