大規模言語モデルの重み付き階層型アンサンブルによる自動マルウェアファミリ分類
arXiv cs.AI / 2026/4/6
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- 本論文は、難読化やパッキングにより従来の教師あり機械学習がラベル付きデータや手作りの特徴量に依存しがちで、スケーラビリティに課題がある「オープンワールド条件」におけるマルウェアファミリ分類に取り組む。
- 事前学習済みのLLM(大規模言語モデル)を用いた重み付き階層型アンサンブルにより、学習や特徴量学習を行わずに複数モデルの意思決定レベルの出力を統合する「ゼロラベル」フレームワークを提案する。
- アンサンブルは、経験的に導出したマクロF1スコアに基づいて各LLMの寄与度に重みを与え、まずは粗い悪性挙動を判定し、その後に細かなマルウェアファミリへと絞り込む階層戦略を適用する。
- 著者らは、階層的な集約により頑健性が向上し、単一モデルによる不安定性を低減できると主張している。また、アナリストの推論スタイルにより適合するとしている。



