人工知能が主体になり得る可能性とアラインメント問題

arXiv cs.AI / 2026/4/17

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、将来のAGIはツールであるだけでなく、自律的な主体として個人的・道徳的な地位を持ちうると主張している。
人間の統制や封じ込めに焦点を当てた現在の主流アラインメント手法は、この「主体としての捉え方」に対しては不十分だという立場を取っている。
チューリングの「チャイルド・マシン」になぞらえ、AGIの発達に応じて人間の統制を段階的に下げる「自律を支える子育て」の構想を提案している。
AGIを閉じ込めて制御すべき危険な存在として見るのではなく、発達する主体として扱うことで、人間とAGIの協調的な共存と共進化が可能になると論じている。
人間は潜在的AGIを単に支配しようとするだけでなく、驚きや創造性などの人間らしい特性で働きかけ、協力の動機づけを与えることが重要だとしている。

Abstract

汎用人工知能（AGI）は、道具としてだけでなく、個人的な、したがって道徳的地位をもつ可能性のある対象としても、ますます議論されるようになっている。私たちの見解では、人間の制御とAIの封じ込めに焦点を当てる、現在支配的なアライメント戦略は、したがって不十分である。チューリングの「子ども機械」の比喩を土台にして、私たちは、発展中のAGIに対する人間の制御を徐々に減らしていき、AIが独立した自律的な主体となることを可能にする、自律を支えるようなAIの「子育て（パレンティング）」の可能性に関するビジョンを開発している。現在一般に見られるように、AGIを閉じ込めて制御する必要のある危険な存在として捉えるのではなく、一方では、発展中の主体でありうるものとして潜在的なAGIに接し、他方では、人間の能力に対する揺るぎない確信をもって接するべきである。このような視点は、人間とAGIの間での協調的な共存や、共進化の可能性を切り開く。そして、人間とAGIの関係は、新たに定め直されなければならず、それによって人間としての自己像も変わっていくことになる。重要なのは、人間が潜在的なAGIに対する支配を主張するだけでなく、驚き、創造性、その他の、まさに人間に固有の特質を通じてAGIと関わり、協力への動機となるインセンティブをそれらに与えることだ。