要約: 大規模モデルは、通常、モデル所有者とユーザーの多様な要件を満たすように適応されます。
しかし、モデルの複数の専門的なバージョンを維持することは非効率的です。
これに応じて、我々はAIMという新規のモデルモデュレーション・パラダイムを提案します。これは、単一のモデルが特定の最終要件を満たすために多様な挙動を示すことを可能にします。
AIMは、2つの主要なモジュレーションモードを可能にします。すなわち、ユーティリティモジュレーションとフォーカスモジュレーションです。
前者は出力品質を動的に制御できるようにして、さまざまな有用性レベルを提供します。後者は、ユーザーにモデルの焦点を絞った入力特徴を調整するための正確な制御を提供します。
AIMは、トレーニングデータに依存しない、再学習不要な方法で機能するロジット再分配戦略を導入します。
結合確率分布によるロジット順序の統計的特性に基づき、AIMの規制能力を保証する形式的な基盤を確立します。
我々の評価は、AIモデルモデュレーションにおけるAIMの実用性と汎用性を確認しており、画像分類、セマンティックセグメンテーション、テキスト生成にわたるタスクや、ResNet、SegFormer、Llamaを含む一般的なアーキテクチャに適用可能であることを示しています。
ロジット再分布を用いたAIモデルのモデュレーション
arXiv cs.AI / 2026/3/16
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- AIMは、単一のモデルが多様な挙動を示し、異なる所有者およびユーザーの要件に対応できる新しいモデルモデュレーションのパラダイムです。
- 2つのモデュレーションモードを導入します:動的な出力品質の制御のためのユーティリティモデュレーションと、モデルが注目する入力特徴を誘導するフォーカスモデュレーション。
- このアプローチは、訓練データに依存せず、再訓練不要なロジット再分布戦略を用いており、ロジットの順序の結合分布による統計的性質に基づいています。
- 評価は、画像分類、セマンティックセグメンテーション、テキスト生成の分野におけるAIMの実用性を示しており、ResNet、SegFormer、Llamaといったアーキテクチャのサポートを含みます。

