Abstract
深層学習の学習は非決定的です。同一のコードでも異なる乱数シードを用いると、モデルは集計指標では一致する一方で個々の予測では一致しません。特にまれな臨床クラスでは、クラスごとのAUCの振れ幅が20パーセントポイントを超えることがあります。本稿では、3つのランダム性の源を除去する、検証済みのビット同一(bit-identical)学習のための枠組みを提示します。ランダム性の源とは、(1) 重みの初期化(構造化された直交基底関数による)、(2) バッチ順序(黄金比スケジューリングによる)、(3) 非決定的なGPU演算(アーキテクチャ選択およびカスタムautogradによる)です。このパイプラインにより、独立した実行の間でMD5検証された同一の学習済み重みを生成します。
PTB-XLの心電図(ECG)リズム分類において、構造化初期化は2つのアーキテクチャすべてでKaimingを有意に上回ります(n=20; Conformer p = 0.016、Baseline p < 0.001)。これにより集計分散が2〜3倍に低減し、まれなリズムにおけるクラスごとの変動性も最大7.5倍低減します(TRIGU範囲: Kaimingで4.1pp vs 30.9pp、3-fold CVによって独立に確認)。n=20における4基底の比較では、すべての構造化直交基底が同等の性能を示します(Friedman p=0.48)。これは、寄与しているのが特定の基底関数ではなく、決定的な構造化初期化そのものであることを示します。7つのMedMNISTベンチマークに対するドメイン横断の検証(n=20、すべてp > 0.14)では、標準タスクで性能低下がないことが確認されます。不均衡タスク(ChestMNIST、RetinaMNIST)に対するクラスごとの分析では、ECGで観測されたまれなクラスに対するのと同様の分散低減が示されます。3つの外部ECGデータベースでのクロスデータセット評価では、ゼロショット汎化が確認され(>0.93 AFIB AUC)、ゼロショットでの一般化性能が得られています。