ReaGeo: Reasoning-Enhanced End-to-End Geocoding with LLMs

arXiv cs.CL / 4/24/2026

💬 OpinionIdeas & Deep AnalysisModels & Research

Key Points

  • ReaGeoは、従来の多段階ジオコーディング手法が抱える手順の複雑さ、誤差伝播、構造化地理知識ベースへの依存といった課題を、LLMを用いたエンドツーエンド枠組みで解決することを狙った提案です。
  • 具体的には、座標をジオハッシュ列へ変換し、座標推定をテキスト生成問題として定式化することで、地理座標の予測を一つの生成タスクとして扱います。
  • Chain-of-Thought(思考連鎖)を導入して空間関係の推論を強化し、さらに距離のずれに基づく報酬で強化学習を行うことで生成精度の最適化を図っています。
  • 実験では、明示的な住所クエリに対する単一点予測の精度や、「〜の近く」といった曖昧な相対位置クエリの解決能力が示され、点以外の幾何学的領域にも高い予測性能と汎化性があると報告されています。

Abstract

This paper proposes ReaGeo, an end-to-end geocoding framework based on large language models, designed to overcome the limitations of traditional multi-stage approaches that rely on text or vector similarity retrieval over geographic databases, including workflow complexity, error propagation, and heavy dependence on structured geographic knowledge bases. The method converts geographic coordinates into geohash sequences, reformulating the coordinate prediction task as a text generation problem, and introduces a Chain-of-Thought mechanism to enhance the model's reasoning over spatial relationships. Furthermore, reinforcement learning with a distance-deviation-based reward is applied to optimize the generation accuracy. Comprehensive experiments show that ReaGeo can accurately handle explicit address queries in single-point predictions and effectively resolve vague relative location queries. In addition, the model demonstrates strong predictive capability for non-point geometric regions, highlighting its versatility and generalization ability in geocoding tasks.