AGIに向けた進捗の測定：認知的枠組み

Google DeepMind Blog / 2026/3/18

💬 オピニオンIdeas & Deep AnalysisModels & Research

原文を読む →

共有:

要点

本記事は、人工一般知能（AGI）へ向けた進捗を測定するための認知的枠組みを提案する。
AIシステム全体の認知能力を評価するための具体的な基準と指標を概説する。
ベンチマーク、能力、および実践的なアラインメントの課題の違いを明確にする。
AGIのマイルストーンが追求される中で、研究者、プロダクトチーム、ビジネス戦略、政策に対する示唆について論じる。

AGIに向けた進捗の測定: 認知フレームワーク

2026年3月17日

x.com

Facebook

Mail

リンクをコピー

We’re introducing a framework to measure progress toward AGI, and launching a Kaggle hackathon to build the relevant evaluations.

Ryan Burnell

リサーチサイエンティスト、Google DeepMind

Oran Kelly

プロダクトマネージャー、Google DeepMind

AI が生成した要約を読む

一般的な要約

Google DeepMind は、認知科学を用いて人工一般知能（AGI）の進歩を測定することに協力したいと考えています。彼らの新しい論文「Measuring Progress Toward AGI: A Cognitive Taxonomy」は、AIシステムの認知能力を理解するための枠組みを提示します。主要な認知能力の評価を設計することで、彼らの Kaggle ハッカソンに参加し、20万ドルの賞金総額の中から賞を獲得する機会があります。

要約は Google AI によって生成されました。生成系AIは実験的です。

x.com

Facebook

Mail

リンクをコピー

画像には斜めに並ぶ複数の長方形が見え、それぞれの長方形には渦巻き模様があります。

お使いのブラウザはオーディオ要素をサポートしていません。

記事を聴く

このコンテンツは Google AI によって生成されました。生成 AI は実験的です

[[duration]] 分

声再生速度

音声

再生速度 0.75X 1X 1.5X 2X

人工汎用知能（AGI）は、科学的発見を加速させ、人類が直面する最も差し迫った課題のいくつかを解決する可能性を秘めています。しかし、この重要なマイルストーンがどれだけ近いのかを判断するのは難しい場合があります。システムの汎用知能を評価する実証的ツールが不足しているためです。AGIへの進捗を追跡するには、さまざまな方法とアプローチが必要であり、認知科学はその謎の重要な一部を提供すると私たちは信じています。

それが理由で、私たちは新しい論文「AGIへの進捗測定: 認知分類」を公開します。これは、AIシステムの認知能力を理解するための科学的基盤を提示します。

論文と共に、私たちは Kaggleと協力してハッカソンを開催し、研究コミュニティにこのフレームワークを実践に活かすための評価作りに協力してもらうことを呼び掛けます。

汎用知能の分解

私たちの枠組みは、心理学、神経科学、認知科学の数十年にわたる研究を基に、認知分類を開発します。AIシステムにおける汎用知能にとって重要になると私たちが仮定する10の認知能力を特定します：

知覚: 環境から感覚情報を抽出・処理する
生成: テキスト、音声、行動などの出力を生成する
注意: 重要なことに認知資源を集中させる
学習: 経験と指導を通じて新しい知識を獲得する
記憶: 時間を超えて情報を保存・検索する
推論: 論理的推論を通じて妥当な結論を導く
メタ認知: 自身の認知プロセスに関する知識と監視
実行機能: 計画、抑制、認知的柔軟性
問題解決: ドメイン固有の問題に対する効果的な解決策を見つける
社会的認知: 社会情報を処理・解釈し、社会的状況で適切に対応する

Bubbles all connecting to the central bubble "Cognitive faculties". Each bubble list a cognitive faculty.

これらの認知能力におけるAIの能力を理解するため、私たちは人間の能力と比較してシステムの性能を評価する3段階の評価プロトコルを提案します：

各能力を網羅する広範な認知タスクのセットに対してAIシステムを評価し、データ汚染を防ぐためにホールドアウトテストセットを使用する
同じタスクについて、人口統計的に代表的な成人サンプルから人間のベースラインを収集する
各能力における人間の性能分布に対する各AIシステムの性能をマッピングする

理論から実践へ

これらの認知能力を定義することは重要な第一歩ですが、進捗を測定するための枠組み以上のものが必要です。この理論を実践に落とすべく、新しいKaggleハッカソンを開催します — AGIへの進捗測定: 認知能力」。このハッカソンは、評価ギャップが最も大きい5つの認知能力（学習、メタ認知、注意、実行機能、社会的認知）についての評価を設計するよう、コミュニティに促します。

Kaggleが新たに開始したコミュニティ・ベンチマークプラットフォームを使って、最前線モデルのラインアップに対して評価を構築・テストすることができます。

総賞金額は200,000ドルです。5つのトラックそれぞれの上位2件には10,000ドルの賞金、そして総合で最も優れた4件には25,000ドルのグランドプライズを授与します。提出は3月17日から4月16日まで受け付け、結果は6月1日に発表します。開始するには Kaggle のウェブサイトへアクセスしてください。

Google からのストーリーを受信トレイで受け取りましょう。 Google のストーリーをもっと受信トレイで受け取りましょう。

メールアドレス

お客様の情報は、Googleのプライバシーポリシーに従って使用されます。 Google のプライバシーポリシー

購読する

完了しました。あと一歩です。

購読を確認するには受信トレイを確認してください。

すでにニュースレターに登録しています。

また、別のメールアドレスでも購読できます。別のメールアドレス。

掲載先:

AIはバブルになりつつあり、ドットコム崩壊のような結末を迎えるのか？

Reddit r/artificial

状態の外部化

Dev.to

1対1のRTSゲームで、LLMsがユニットを制御するコードを書く『ベンチマーク』を作成した

Dev.to

私のAIには時計がない

Dev.to

コーディング向けの LLM をどう選ぶべきか？注目すべきパラメータは何か？

Reddit r/LocalLLaMA

AGIに向けた進捗の測定：認知的枠組み

要点

AGIに向けた進捗の測定: 認知フレームワーク

一般的な要約

汎用知能の分解

理論から実践へ

Google からのストーリーを受信トレイで受け取りましょう。 Google のストーリーをもっと受信トレイで受け取りましょう。