視覚言語モデルの構造グラフ・プロービング
arXiv cs.CV / 2026/3/31
📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research
要点
- 本論文は、各層をニューロンの共活性に基づいて構築される同一層内の相関グラフとして扱うことで、視覚言語モデルを解析し、計算を「ニューラル・トポロジー」という観点から捉えることを可能にする。
- 相関トポロジーには回復可能な行動(ベイビア)の信号が含まれており、モダリティやネットワークの深さに応じて体系的に変化することを見出す。
- 深さが増すにつれて、層間でのクロスモーダルな構造が、比較的コンパクトな反復ハブ・ニューロンの集合の周りでより統合されていくことを示す。
- これらのハブ・ニューロンに対する狙いを定めた摂動(パートバーブ)によりモデル出力が大きく変化し、同定された構成要素が因果的に重要であることを示唆する。
- 著者らは、ニューラル・トポロジーを解釈可能性(インタープリタビリティ)のための有用な中間表現として位置づける。すなわち、局所的アトリビューションより情報量が多い一方で、回路レベルでの完全な復元よりも扱いやすいとし、コードを公開する。



