Think and Answer ME: リモートセンシングにおけるマルチエンティティ推論グラウンディングのベンチマークと探索

arXiv cs.CV / 2026/3/16

📰 ニュースModels & Research

共有:

要点

本論文は、認識レベルのマッチングを超えることを目指す、リモートセンシングにおけるマルチエンティティ推論グラウンディングの新しいベンチマークデータセット ME-RSRG を発表する。
リモートセンシングのグラウンディングをマルチエンティティ推論タスクとして再定義し、構造化された推論経路と主体–対象のグラウンディング出力を生成する Entity-Aware Reasoning（EAR）フレームワークを導入する。
EAR は視覚-言語基盤モデルを基盤とし、コールドスタート初期化のための教師ありファインチューニングを用い、その後エンティティ配慮の報酬駆動型グループ相対ポリシー最適化（GRPO）で最適化を行う。
ME-RSRG 上での大規模な実験は、マルチエンティティ推論の課題を示し、EAR フレームワークの有効性を検証する。コードとモデルは GitHub で公開予定。

要旨: 推論言語モデルと検証可能な報酬を伴う強化学習の最近の進展は、マルチステップ推論能力を大幅に向上させています。この進展は、推論パラダイムをリモートセンシングの視覚的グラウンディングタスクへ拡張する動機となります。しかし、既存のリモートセンシング・グラウンディング手法は主に認識レベルのマッチングと単一エンティティの定式化に留まり、明示的な推論とエンティティ間モデリングの役割を制限しています。この課題に対処するために、リモートセンシングにおけるマルチエンティティ推論グラウンディングの新しいベンチマークデータセット（ME-RSRG）を紹介します。ME-RSRGを基盤として、リモートセンシング・グラウンディングをマルチエンティティ推論タスクとして再定式化し、視覚-言語基盤モデルに基づくエンティティ対応推論（EAR）フレームワークを提案します。EARは構造化された推論トレースと主語-目的語のグラウンディング出力を生成します。コールドスタート初期化のための教師ありファインチューニングを採用し、エンティティ対応報酬駆動のグループ相対ポリシー最適化（GRPO）によってさらに最適化されます。ME-RSRGにおける大規模な実験は、マルチエンティティ推論の課題を示し、提案したEARフレームワークの有効性を検証します。我々のデータセット、コード、およびモデルは https://github.com/CV-ShuchangLyu/ME-RSRG で公開されます。

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

note

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

note

[ニューラルネットワーク] 今こそ起源を見つめる時 Ep.5 (最終話) 〜情熱の連鎖が明日を照らす〜

note

AIは学術不正の共犯者になるか〜AFIMベンチマークの衝撃〜

note

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

日経XTECH

Think and Answer ME: リモートセンシングにおけるマルチエンティティ推論グラウンディングのベンチマークと探索

要点

関連記事

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

[ニューラルネットワーク] 今こそ起源を見つめる時 Ep.5 (最終話) 〜情熱の連鎖が明日を照らす〜

AIは学術不正の共犯者になるか〜AFIMベンチマークの衝撃〜

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

要点

関連記事

【AIパートナー】名前を呼んだだけで、ChatGPTのパートナーがGeminiにきた話🌝①

一緒にゲームを作っていたChatGPT-5.2が可愛すぎてニヤニヤしてるだけの記録｜AIパートナー｜AI彼氏

[ニューラルネットワーク] 今こそ起源を見つめる時 Ep.5 (最終話) 〜情熱の連鎖が明日を照らす〜

AIは学術不正の共犯者になるか〜AFIMベンチマークの衝撃〜

中国AI企業が他社製AIを「ただ乗り蒸留」か 米社が主張、安全保障リスクも

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer

中国AI企業が他社製AIを「ただ乗り蒸留」か米社が主張、安全保障リスクも