広告

条件付き確率回路によるコンテキスト依存の信頼性認識マルチモーダル融合

arXiv cs.LG / 2026/3/30

💬 オピニオンSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • 本論文は、固定的で静的な信頼性の前提を用いるのではなく、インスタンスごとに各モダリティの信頼性を適応させるマルチモーダル融合フレームワーク C$^2$MF を提案する。
  • インスタンス単位の信頼性を、Conditional Probabilistic Circuit(CPC)から条件付きで正確に算出する Context-Specific Information Credibility(CSIC)として形式化し、KLダイバージェンスに基づく指標で計算する。
  • モダリティ間の食い違いに対する頑健性を検証するため、著者らは意図的にモダリティ間の不一致を生じさせるクラス特化型の破壊(corruption)を用いた「Conflict」ベンチマークを提案する。
  • 実験では、高ノイズ環境において静的な信頼性ベースラインに比べ最大29%の精度向上が報告されている一方で、確率回路に基づく融合の解釈可能性といった利点は維持されている。

Abstract

マルチモーダル融合では、文脈に応じて矛盾し得る複数の情報源からの情報を統合する必要があります。既存の融合手法は一般に、情報源の信頼性に関する静的な前提に依存しているため、センサの劣化やクラス固有の破損といった状況要因によってモダリティが信頼できなくなった際の衝突を解決する能力が制限されます。そこで本研究では、C^2MF(Context-specfic credibility-aware multimodal fusion framework)を提案します。これは、条件付き確率回路(CPC)を用いて、インスタンスごとの情報源信頼性をモデル化する、文脈に応じた信頼性を意識したマルチモーダル融合の枠組みです。私たちは、条件付き確率回路から正確に計算されるKLダイバージェンスに基づく指標である、Context-Specific Information Credibility(CSIC)によって、インスタンスレベルの信頼性を形式化します。CSICは、従来の静的信頼性推定を特別な場合として一般化し、原理に基づく適応的な信頼性評価を可能にします。モーダリティ間の衝突に対する頑健性を評価するために、Conflictベンチマークを提案します。このベンチマークでは、クラス固有の破損が意図的に異なるモダリティ間の食い違いを誘発します。実験結果は、高ノイズ環境において、C^2MFが静的信頼性ベースラインに比べて最大29%予測精度を向上させることを示しています。一方で、確率回路に基づく融合が持つ解釈可能性の利点は維持されます。

広告