低品質データでのマルチモーダル学習：Conformal Predictive Self-Calibration

arXiv cs.CV / 2026/5/6

📰 ニュースIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、モダリティ間の不均衡とノイズ混入というマルチモーダル学習の課題を、学習中にモダリティや各インスタンスの信頼性に対する予測不確実性が適切に較正されていないことに共通の根を見出しています。
Conformal Predictive Self-Calibration（CPSC）という統一的フレームワークを提案し、共形予測を用いて学習中に自己誘導型のオンライン較正を可能にします。
CPSCは、表現の自己較正（単一モダリティ特徴を分解し、共形予測が特定した頑健な成分のみを選択的に融合）と、勾配の自己較正（インスタンスごとの信頼性スコアに基づいて逆伝播の勾配フローを再調整）を組み合わせます。
共形予測器に対する自己更新戦略も設計しており、学習の過程を通じてシステム全体が整合的に同時進化できるようにしています。
6つのベンチマークデータセットで、不均衡・ノイズの両設定において既存の最先端手法を一貫して上回ることを実験で示し、コードもGitHubで公開しています。

Abstract

マルチモーダル学習はしばしば、低品質なデータという課題に取り組む必要があり、その主な現れとして2つの側面があります。すなわち、モダリティの不均衡と、ノイズによる破損です。これらの問題はしばしば個別に研究されてきましたが、本論文では、学習中における個々のモダリティとインスタンスの信頼性に対する予測上の不確実性が共通の根本原因になっていることを主張します。本論文では、共形予測（conformal prediction）を活用して、モデルが学習のその場で自己主導的に較正できるようにする統一フレームワーク Conformal Predictive Self-Calibration（CPSC）を提案します。提案するCPSCの中核は、新しい自己較正型の学習ループにあり、これが2つの主要モジュールをシームレスに統合します。（1）Representation Self-Calibration（表現自己較正）。これは単一モダリティの特徴を構成要素へ分解し、共形予測器によって同定された最も頑健なものを選択的に融合することで、特徴の耐性を高めます。（2）Gradient Self-Calibration（勾配自己較正）。これは、インスタンスごとの信頼性スコアに基づいて、逆伝播中の勾配の流れを再較正し、最適化をより信頼できる方向へと導きます。さらに、共形予測器のための自己更新戦略も考案し、学習プロセス全体を通じてシステム全体が一貫して共進化することを保証します。不均衡およびノイズの両設定において、6つのベンチマークデータセットで行った広範な実験により、提案するCPSCフレームワークが既存の最先端手法を一貫して上回ることを示します。コードは https://github.com/XunCHN/CPSC で公開しています。

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

日経XTECH

2026年版：学生のための無料AIツールトップ10—究極の学習ガイド

Dev.to

AIを“保険の相棒”に：結婚式当日の「もしも」を自動化する

Dev.to

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

MarkTechPost

Claudeが法廷でハルシネーションを起こすとどうなるか：Latham＆Watkinsの事案と弁護士の責任の意味

MarkTechPost

低品質データでのマルチモーダル学習：Conformal Predictive Self-Calibration

要点

Abstract

関連記事

DXは継続、AI活用の新需要を ITサービス（SIer）の業界地図

2026年版：学生のための無料AIツールトップ10—究極の学習ガイド

AIを“保険の相棒”に：結婚式当日の「もしも」を自動化する

Google、Gemma 4向け「Multi-Token Prediction（MTP）Drafters」をリリース——品質を落とさず最大3倍高速推論

Claudeが法廷でハルシネーションを起こすとどうなるか：Latham＆Watkinsの事案と弁護士の責任の意味

関連おすすめサービス

Notta搭載AI議事録イヤホン ZENCHORD1

AI搭載ボイスレコーダー Plaud

画像高画質化AIツール Aiarty Image Enhancer