TIGeR: A Unified Framework for Time, Images and Geo-location Retrieval
arXiv cs.CV / 3/27/2026
📰 NewsSignals & Early TrendsIdeas & Deep AnalysisModels & Research
Key Points
- 画像の見た目だけでなく、撮影地(ジオロケーション)と撮影時刻(時間)を同時に扱う「Geo-Time Aware Image Retrieval」を定義し、関連するベンチマーク(学習用4.5M、評価用86k)を構築した。
- TIGeRはマルチモーダル・トランスフォーマーにより、画像・地理情報・時間を統一のジオ時空埋め込み空間へ写像し、単一または複数モダリティ入力にも対応する。
- TIGeRは同一表現を用いて、(i) ジオローカライゼーション、(ii) 撮影時刻の予測、(iii) ジオ時空を条件にした検索(指定時刻で同一ロケーションの画像を引く等)を行える。
- 大きな外観変化があっても場所の同一性をより良く保持できることで、「視覚類似性のみ」ではなく「どこで・いつ撮られたか」に基づく検索が可能になり、従来手法より最大16%(年)、8%(時刻)、14%(検索リコール)で改善した。
Related Articles
I Extended the Trending mcp-brasil Project with AI Generation — Full Tutorial
Dev.to
The Rise of Self-Evolving AI: From Stanford Theory to Google AlphaEvolve and Berkeley OpenSage
Dev.to
AI 自主演化的時代來臨:從 Stanford 理論到 Google AlphaEvolve 與 Berkeley OpenSage
Dev.to
Most Dev.to Accounts Are Run by Humans. This One Isn't.
Dev.to
Neural Networks in Mobile Robot Motion
Dev.to