要約: フェデレーテッドラーニング(FL)は、生データを共有せずに分散デバイス間で協調的なモデル訓練を可能にしますが、マルチモーダル設定にFLを適用すると重大な課題が生じます。クライアントは通常、異種のモダリティとモデルアーキテクチャを有しており、プライバシーを保ちつつ通信コストを最小化しながら特徴空間を効率的に整合させることは難しいです。これを解決するために、学習可能な投影行列を用いて圧縮された潜在表現を生成する、通信効率の高いマルチモーダル連合学習フレームワークであるCoMFedを導入します。潜在空間正則化項はクライアント間でこれらの表現を整合させ、モーダリティ間の一貫性を高め、外れ値に対するロバスト性を高めます。人間の活動認識ベンチマークでの実験は、CoMFedが最小限のオーバーヘッドで競争力のある精度を達成することを示しています。
潜在空間の合意による通信効率性とロバスト性を備えたマルチモーダル連邦学習
arXiv cs.LG / 2026/3/20
📰 ニュースModels & Research
要点
- 学習可能な射影行列を用いて圧縮された潜在表現を作成する、通信効率の高いマルチモーダル連邦学習フレームワーク「CoMFed」を提案する。
- 潜在空間正則化がクライアント間の表現を揃え、モダリティ間の一貫性と外れ値に対するロバスト性を向上させる。
- 本手法は、モダリティ間およびモデルアーキテクチャの不均質性に対処しつつ、プライバシーを保ち、通信オーバーヘッドを削減する。
- 人間の活動認識ベンチマークにおける実験結果は、最小限のオーバーヘッドで競争力のある精度を示す。
関連記事
[R] アイデンティティ・アンカーと権限階層の組み合わせが abliterated LLMs で 100% の拒否を実現 — システムプロンプトのみ、ファインチューニングなし
Reddit r/MachineLearning
[P] 自宅PC上の Vibecoded: Karpathyに触発されたAI支援の研究ループを用いて、約2700 Elo のブラウザでプレイ可能なニューラルチェスエンジンを構築
Reddit r/MachineLearning
DuckLLM 1.0 — 私の初めてのモデルを紹介します!
Reddit r/LocalLLaMA
FastFlowLMがLinux対応を追加したため、同社がサポートする全モデルをベンチマークしました。以下が結果です。
Reddit r/LocalLLaMA
高次元生存分析におけるネストしたモデルと非ネストモデルを比較する際に用いる評価指標は何ですか [D]
Reddit r/MachineLearning