広告

EngineAD: 実環境の車両エンジン異常検知データセット

arXiv cs.LG / 2026/3/30

📰 ニュースSignals & Early TrendsIdeas & Deep AnalysisModels & Research

要点

  • EngineADは、6か月間にわたって収集した高解像度テレメトリをもとに、25台の商用車から構築された車両異常検知のための新たな多変量ベンチマークデータセットです。
  • このデータセットは、合成データではなく実運用時の挙動を重視しており、正常状態と、エンジン故障の前兆となる初期指標を専門家の注釈によりラベル付けしています。
  • データは300タイムステップの区間に前処理され、8つの主成分で表現されており、著者らは9つのワンクラス異常検知モデルによる初期ベンチマークを提示しています。
  • 結果は車両ごとの性能に大きなばらつきがあることを示しており、実環境での導入における車両間の汎化の難しさを浮き彫りにしています。
  • 本研究では、K-MeansやOne-Class SVMといった単純な古典的なワンクラス手法が、この区間ベースの評価において非常に競争力が高く、場合によっては深層学習を上回ることがあると明らかにしています。

Abstract

The progress of Anomaly Detection (AD) in safety-critical domains, such as transportation, is severely constrained by the lack of large-scale, real-world benchmarks. To address this, we introduce EngineAD, a novel, multivariate dataset comprising high-resolution sensor telemetry collected from a fleet of 25 commercial vehicles over a six-month period. Unlike synthetic datasets, EngineAD features authentic operational data labeled with expert annotations, distinguishing normal states from subtle indicators of incipient engine faults. We preprocess the data into 300-timestep segments of 8 principal components and establish an initial benchmark using nine diverse one-class anomaly detection models. Our experiments reveal significant performance variability across the vehicle fleet, underscoring the challenge of cross-vehicle generalization. Furthermore, our findings corroborate recent literature, showing that simple classical methods (e.g., K-Means and One-Class SVM) are often highly competitive with, or superior to, deep learning approaches in this segment-based evaluation. By publicly releasing EngineAD, we aim to provide a realistic, challenging resource for developing robust and field-deployable anomaly detection and anomaly prediction solutions for the automotive industry.

広告