対照学習による粒状ボール学習強化を用いた堅牢なスマートコントラクト脆弱性検出

arXiv cs.LG / 2026/3/31

💬 オピニオンIdeas & Deep AnalysisModels & Research

共有:

要点

本論文は、スマートコントラクト脆弱性検出研究における重要なギャップを扱う。すなわち、オープンソースのラベリングツールへの依存によって生じる学習データのラベルノイズである。

Abstract

深層ニューラルネットワーク（DNN）は、契約データセットの拡大と高度な深層学習手法の発展に後押しされ、スマートコントラクトの脆弱性を検出するための有力なアプローチとして注目されるようになってきました。しかし、DNNは通常、契約の特徴と脆弱性ラベルの間の関係をモデル化するために、大規模なラベル付きデータセットを必要とします。実際には、ラベル付けプロセスは既存のオープンソースのツールに依存することが多く、その精度は保証できません。その結果、ラベルノイズは、文献ではほとんど検討されていないにもかかわらず、スマートコントラクトの精度と頑健性に対する重大な課題となります。そこで本研究では、コントラスト学習を強化した粒度球（Granular-Ball）スマートコントラクトの学習、CGBCを提案し、契約脆弱性検出の頑健性を高めます。具体的には、CGBCはまず、エンコーダ層と分類器層の間に粒度球計算層を導入し、類似した契約を粒度球（GB）へとグループ化し、それらに対して新しい粗い表現（すなわちGBの中心とラベル）を生成します。これにより、最も正しいサンプルに基づいてノイズのあるラベルを修正できます。クラスタリングの有効性を高めるために、GB間のコンパクト性損失と、GB内の緩み（loosenness）損失を組み合わせます。次に、GBの精度を向上させるために、独自のセマンティック整合スマートコントラクト拡張手法により支えられた教師なしコントラスト学習を通じてモデルを事前学習します。この手順は、類似した契約同士の表現をより近づけることで、異なるラベルを持つ契約を識別し、CGBCのクラスタリングを支援します。続いて、対称型クロスエントロピー損失関数を用いてモデルの質を測定し、勾配計算におけるラベルノイズに対抗します。最後に、広範な実験により、提案手法のCGBCは、ベースラインと比較した場合に、スマートコントラクト脆弱性検出の頑健性と有効性を大幅に改善できることが示されます。