計算機科学 > 計算と言語
arXiv:2603.06590(cs)
[2026年2月4日投稿]
題目:ARC-AGI-2 Technical Report
著者:Wallyson Lemes de Oliveira, Mekhron Bobokhonov, Matteo Caorsi, Aldo Podestà, Gabriele Beltramo, Luca Crosato, Matteo Bonotto, Federica Cecchetto, Hadrien Espic, Dan Titus Salajan, Stefan Taga, Luca Pana, Joe Carthy
Wallyson Lemes de Oliveira および他12名の著者による論文「ARC-AGI-2 Technical Report」のPDFを表示
PDFを表示
HTML(実験的)
要旨:抽象化と推論コーパス(ARC)は、単なるパターン照合を超えた汎化を評価するために設計されており、非常に少ない例から記号的ルールを推論することが要求されます。本研究では、ニューラル推論と、構造を考慮した事前(プリオル)およびオンライン課題適応を組み合わせることでARCの性能を向上させる、トランスフォーマーに基づくシステムを提示します。提案手法は4つの主要なアイデアに基づいています。第一に、ARCの推論を、125トークンだけのコンパクトなタスク符号化を用いて、系列モデリング問題として再定式化します。これにより、改良したLongT5アーキテクチャで効率的な長文脈処理を可能にします。第二に、グループ対称性、グリッドのトラバース(走査)、オートマトンの摂動に基づく、原理に立脚したデータ拡張フレームワークを導入し、表現の変化に対する不変性を強制します。第三に、軽量なLoRA適応を用いたテスト時学習(TTT)を適用し、デモンストレーションからその変換ロジックを学習することで、未見の各タスクにモデルを特化させます。第四に、対称性を考慮したデコードおよびスコアリングのパイプラインを設計し、拡張されたタスクの見え方ごとの尤度を集約します。これにより、候補解に対して実質的に「複数の視点による推論」を行います。これらの構成要素は相乗的に働くことを示します。拡張は仮説空間を広げ、TTTは局所的な推論を鋭くし、対称性に基づくスコアリングは解の一貫性を改善します。最終的なシステムは、トランスフォーマーのベースラインに対して大幅な改善を達成し、これまでのニューラルARCソルバを上回ります。人間レベルの汎化に向けたギャップを埋めることに近づきます。
| コメント: | |
| 分野: | 計算と言語(cs.CL); 人工知能(cs.AI) |
| 引用: | arXiv:2603.06590 [cs.CL] |
| (このバージョンの場合は arXiv:2603.06590v1 [cs.CL] ) | |
| https://doi.org/10.48550/arXiv.2603.06590
さらに詳しく知るにはここにフォーカス
DataCite 経由で発行された arXiv の DOI
|
書誌ツール
コード、データ、メディア
デモ
関連論文
arXivLabsについて
書誌および引用ツール
Bibliographic Explorer トグル
Bibliographic Explorer (エクスプローラーとは?)
Connected Papers トグル
Connected Papers (Connected Papers とは?)
Litmaps トグル
Litmaps (Litmaps とは?)
scite.ai トグル
scite Smart Citations (スマート引用とは?)
この記事に関連するコード、データ、メディア
alphaXiv トグル
alphaXiv (alphaXiv とは?)
コードへのリンク トグル
CatalyzeX 論文向けコードファインダー (CatalyzeX とは?)
DagsHub トグル
DagsHub (DagsHub とは?)
GotitPub トグル
Gotit.pub (GotitPub とは?)
Huggingface トグル
Hugging Face (Huggingface とは?)
コードへのリンク トグル
Papers with Code (Papers with Code とは?)
ScienceCast トグル
ScienceCast (ScienceCast とは?)
デモ
Replicate トグル
Replicate (Replicate とは?)
Spaces トグル
Hugging Face Spaces (Spaces とは?)
Spaces トグル
TXYZ.AI (TXYZ.AI とは?)
推薦システムと検索ツール
Influence Flower へのリンク
Influence Flower (Influence Flower とは?)
Core 推薦トグル
CORE Recommender (COREとは?)
arXivLabs:コミュニティの協力者と取り組む実験的プロジェクト
arXivLabsは、協力者が当サイト上で新しいarXivの機能を直接開発し、共有できるようにするためのフレームワークです。
arXivLabsに取り組む個人および組織は、オープン性、コミュニティ、卓越性、利用者データのプライバシーという価値観を受け入れ、それを重視してきました。arXivはこれらの価値観にコミットしており、それらを遵守するパートナーとのみ協業します。
arXivのコミュニティに価値をもたらすプロジェクトのアイデアはありますか? arXivLabsの詳細を読む。



