Abstract
地球観測の基盤モデルは、地表の情報を高密度の埋め込みベクトルへ符号化する。しかし、これら表現の幾何学的構造と、その下流の推論への含意は十分に調査されていない。我々は、Google AlphaEarth の64次元埋め込みについて、12.1百万件のアメリカ大陸部(Continental United States)サンプル(2017--2023)にまたがるマニフォールド幾何を特徴づけ、環境推論のためにこの幾何学的理解を活用するエージェント型システムを開発する。マニフォールドはユークリッド的ではない:有効次元数は、64の生の次元からの参加比率(participation ratio)として13.3であり、局所の内在次元はおよそ10である。接空間は大きく回転し、地点の84\%で60\textdegree{}を超える。また、局所—大域アラインメント(平均|\cos\theta| = 0.17)は、ランダム基準の0.125へと近づく。教師ありの線形プローブは、概念方向がマニフォールド上で回転することを示し、PCA由来の方向とプローブ由来の方向の両方を用いた合成ベクトル演算は、精度が低い。代わりに、検索は物理的に整合した結果を生み出す:局所幾何が検索の一貫性(retrieval coherence)を予測し(R^2 = 0.32)、その値は増加する。こうした特徴づけに基づき、FAISSでインデックス化された埋め込みデータベース上で、環境クエリを推論チェーンへ分解する9つの専門ツールを備えたエージェント型システムを提案する。5条件のアブレーション(120クエリ、3つの複雑性ティア)では、埋め込み検索が応答品質を支配することが示される(パラメトリックのみ:.03 \pm 0.77 vs.\.79 \pm 0.90;スケール1--5)。そして、複数ステップの比較ではピーク性能が得られ(\mu = 4.28 \pm 0.43)、その優位性が見られる。クロスモデルのベンチマークでは、幾何学的ツールがSonnet 4.5のスコアを0.12ポイント低下させる一方で、Opus 4.6のスコアを0.07ポイント向上させる。さらにOpusは高い幾何学的基礎づけ(3.38 vs. 2.64)を達成しており、消費側モデルの推論能力が高いほど、幾何学的特徴づけの価値がスケールすることを示唆している。