RAVENを解くためのDIRCR:Dual-Inference Rule-Contrastive Reasoning

arXiv cs.AI / 2026/4/21

📰 ニュースDeveloper Stack & InfrastructureIdeas & Deep AnalysisModels & Research

要点

  • DIRCR(Dual-Inference Rule-Contrastive Reasoning)モデルは、従来手法がグローバルな文脈かローカルな行ごとの関係のどちらかを重視しがちで、中間特徴の制約も欠けるために、ルールの取り込みが不完全になり表現が絡み合う課題に対処します。
  • DIRCRのDual-Inference Reasoning Moduleは、行ごとのアナロジー推論のためのローカル経路と、全体的な推論のためのグローバル経路を併用し、ゲート付き注意機構で統合します。
  • Rule-Contrastive Learning Moduleでは擬似ラベルを用いてルールのポジ/ネガのサンプルを作成し、コントラスト学習によって特徴の識別性を高めつつ、抽象的で転移可能なルール学習を促します。
  • 3つのRAVENデータセットでの実験により、DIRCRが推論の頑健性と汎化性能を向上させることが示され、コードはGitHubで公開されています。

Abstract

抽象的な視覚推論は依然として難しい。既存の手法は、多くの場合、グローバルな文脈か、あるいはローカルな行ごとの関係のどちらかを優先するが、両者を統合できず、さらに中間的な特徴制約が欠けているため、ルールの取り込みが不完全になり、表現がもつれてしまう。これらの問題に対処するため、我々はDual-Inference Rule-Contrastive Reasoning(DIRCR)モデルを提案する。その中核となる構成要素であるDual-Inference Reasoning Moduleは、行ごとの類推推論のためのローカル経路と、全体的な推論のためのグローバル経路を組み合わせる。これを、ゲート付きアテンション機構によって統合する。加えて、Rule-Contrastive Learning Moduleは、疑似ラベルを導入してポジティブおよびネガティブのルール・サンプルを構築し、コントラストive学習を適用することで、特徴の識別性を高め、抽象的で転移可能なルール学習を促進する。3つのRAVENデータセットでの実験結果は、DIRCRが推論の頑健性と汎化性能を大幅に向上させることを示している。コードは https://github.com/csZack-Zhang/DIRCR で公開されている。