UniICL：能力志向の分類法によって統一型マルチモーダル・イン・コンテキスト学習を体系化する

arXiv cs.CV / 2026/3/27

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、マルチモーダル・イン・コンテキスト学習がとりわけ、実演（デモ）の選択・フォーマットに対して敏感であると主張する。これはモダリティ間の干渉や、異なるタスクの認知的要求によるもので、その結果として、単調ではない（非単調な）タスク依存の性能につながる。
実演が果たす機能的役割を、基礎的な知覚から高次の識別までの段階として診断・体系的に分類する、6段階の能力志向（capability-oriented）タクソノミーを提案する。
著者らは、15のサブタスクにわたって厳選した8ショットのエピソードからなるUniICL-760Kと、統一型マルチモーダル・イン・コンテキスト学習を制御された条件で評価するためのUniICL-Benchを構築する。
少数ショット適応を安定化するために、軽量なプラグ＆プレイ構造モジュールであるContext-Adaptive Prototype Modulatorを提案する。
UniICL-Benchでの実験では、統一型マルチモーダルの競争力のある結果が示され、理解に焦点を当てたほとんどのイン・コンテキスト学習タスクにおいて、大規模なパラメータを持つマルチモーダルLLMのベースラインを上回る。データ／コードは近日公開予定である。

Dev.to

Dev.to

Dev.to

Dev.to

Dev.to