要旨: 本論文では、ReaGeoという、大規模言語モデルに基づくエンドツーエンドのジオコーディングフレームワークを提案する。これは、地理データベース上でテキストまたはベクトル類似検索に依存する従来の多段階アプローチの限界—ワークフローの複雑さ、誤り伝播、構造化された地理知識ベースへの過度な依存—を克服することを目的とする。提案手法は地理座標をジオハッシュ列へと変換し、座標予測タスクをテキスト生成問題として再定式化する。さらに、空間関係に関するモデルの推論を強化するためにChain-of-Thought(連鎖的思考)機構を導入する。加えて、生成精度を最適化するために、距離の偏差に基づく報酬を用いた強化学習を適用する。包括的な実験の結果、ReaGeoは単一点予測において明示的な住所クエリを正確に扱えること、また曖昧な相対位置クエリを効果的に解決できることが示された。さらに本モデルは、非点(点以外)の幾何学的領域に対しても強い予測能力を示し、ジオコーディング課題における汎用性と一般化能力の高さを強調している。
ReaGeo:LLMによる推論強化エンドツーエンド地物コーディング
arXiv cs.CL / 2026/4/24
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- ReaGeoは、従来の多段階ジオコーディング手法が抱える手順の複雑さ、誤差伝播、構造化地理知識ベースへの依存といった課題を、LLMを用いたエンドツーエンド枠組みで解決することを狙った提案です。
- 具体的には、座標をジオハッシュ列へ変換し、座標推定をテキスト生成問題として定式化することで、地理座標の予測を一つの生成タスクとして扱います。
- Chain-of-Thought(思考連鎖)を導入して空間関係の推論を強化し、さらに距離のずれに基づく報酬で強化学習を行うことで生成精度の最適化を図っています。
- 実験では、明示的な住所クエリに対する単一点予測の精度や、「〜の近く」といった曖昧な相対位置クエリの解決能力が示され、点以外の幾何学的領域にも高い予測性能と汎化性があると報告されています。



