UniICL:能力志向の分類法によって統一型マルチモーダル・イン・コンテキスト学習を体系化する
arXiv cs.CV / 2026/3/27
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、マルチモーダル・イン・コンテキスト学習がとりわけ、実演(デモ)の選択・フォーマットに対して敏感であると主張する。これはモダリティ間の干渉や、異なるタスクの認知的要求によるもので、その結果として、単調ではない(非単調な)タスク依存の性能につながる。
- 実演が果たす機能的役割を、基礎的な知覚から高次の識別までの段階として診断・体系的に分類する、6段階の能力志向(capability-oriented)タクソノミーを提案する。
- 著者らは、15のサブタスクにわたって厳選した8ショットのエピソードからなるUniICL-760Kと、統一型マルチモーダル・イン・コンテキスト学習を制御された条件で評価するためのUniICL-Benchを構築する。
- 少数ショット適応を安定化するために、軽量なプラグ&プレイ構造モジュールであるContext-Adaptive Prototype Modulatorを提案する。
- UniICL-Benchでの実験では、統一型マルチモーダルの競争力のある結果が示され、理解に焦点を当てたほとんどのイン・コンテキスト学習タスクにおいて、大規模なパラメータを持つマルチモーダルLLMのベースラインを上回る。データ/コードは近日公開予定である。
広告
