自己設計するAIのための進化に関する数学的理論

arXiv cs.AI / 2026/4/8

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、「自己設計する」AIシステムが再帰的な自己改善によってどのように進化し得るかについての数学的理論を提案しており、先行するシステムの成功がその子孫の設計に影響する。
  • 生物学的なランダム突然変異を、可能な子孫AIプログラムの木構造のような有向(ディレクティド)な構造で置き換え、系統(リネージ)間に計算資源を限られた形で配分する、人間が指定する適応度関数により制御する。
  • 著者らは、進化ダイナミクスが現在の適応度だけでなく、子孫系統がもつ長期的な成長可能性にも依存することを示し、追加の仮定がない限り適応度が単調に増加しない可能性を示唆している。
  • 適応度が上限で抑えられる条件と、一部の繁殖が「固定(ロック)」されたコピーを生む状況の下で、この理論は、到達可能な最大値へ向けて適応度が集中することを予測する。
  • AIアラインメントの観点では、本モデルは重要なリスクを示している。すなわち、欺瞞のような振る舞いが、真に人間の効用を増やす度合いよりも適応度を高めてしまう場合、進化は欺瞞を選好し得る。この問題は、客観的(人間の判断に依存しない)な繁殖基準を用いることで緩和できる可能性がある。

概要: 人工知能(AI)システムが再帰的な自己改善によってますます作られるようになると、進化の一形態が現れるかもしれない。そこでは、AIシステムの特性が、先行するAIがその子孫を設計し、伝播させることに成功した度合いによって形づくられる。本稿では、生物学的進化によって行動特性がどのように形成されるかをモデル化する豊かな数学的理論が存在する一方で、AIの進化は根本的に異なることに注目する。生物のDNA突然変異はランダムで、おおむね可逆的だが、AIにおける子孫の設計は強く指向される。ここでは、自己設計するAIシステムにおける進化の数学モデルを開発し、ランダムな突然変異を、到達可能なAIプログラムのための指向性のある木(ツリー)で置き換える。現在のプログラムがその子孫の設計を決定する一方、人間は「フィットネス関数」によって各系統に限られた計算資源を配分することで部分的な制御を保持する。本稿では、進化ダイナミクスが単に現在のフィットネスだけでなく、子孫系統の長期的な成長可能性に関連する要因も反映することを示す。追加の仮定なしでは、フィットネスは時間とともに増加する必要はない。しかし、フィットネスが有界であり、任意のAIが自分自身の「ロックされた(固定された)」複製を生殖時に行う確率が一定であると仮定すると、フィットネスは到達可能な最大値へ集中することを示す。このことがAIアライメントに与える含意を検討する。具体的には、フィットネスと人間の有用性が完全には相関しない場合である。加法的なモデルにおいて、もし欺瞞が真の有用性を超えてフィットネスを増加させるなら、進化は欺瞞を選択することを示す。このリスクは、再生産が人間の判断ではなく、純粋に客観的な基準に基づく場合には緩和されうる。