要旨: フライトの迂回(diversion)は航空分野において稀なものの、影響が大きい事象であるため、信頼できる予測が安全性と運航効率の両面で不可欠である。しかし、過去の記録におけるそれらの希少性は、予測に利用される機械学習モデルの学習を妨げている。本研究は、生成モデルが合成の迂回記録によって過去のフライトデータをどのように補強し、学習を改善して予測精度を向上させられるかを調査することで、この希少性のギャップに取り組む。3つの深層生成モデル、すなわち Tabular Variational Autoencoder(TVAE)、Conditional Tabular Generative Adversarial Network(CTGAN)、CopulaGAN の最適な構成を特定するために、多目的最適化の枠組みと自動化されたハイパーパラメータ探索を組み合わせて提案する。統計的ベースラインとしては Gaussian Copula(GC)モデルを用いる。合成データの品質は、現実性、多様性、運用上の妥当性、統計的類似性、忠実度、予測有用性を含む6段階の評価枠組みによって検討した。その結果、最適化されたモデルは最適化されていない対応モデルを大幅に上回り、合成による補強は、実データのみで学習したモデルと比べて迂回予測を大きく改善することが示された。これらの知見は、航空輸送における稀な事象の予測モデリングを前進させるために、ハイパーパラメータを最適化した生成モデルが有効であることを示している。
飛行記録の不均衡データを生成的に増強し、飛行転用(ディバージョン)予測を行うための多目的最適化フレームワーク
arXiv cs.LG / 2026/4/23
📰 ニュースIdeas & Deep AnalysisModels & Research
要点
- レアで高影響な飛行転用(ディバージョン)を予測するために、生成モデルで合成の転用記録を作り出して、入手困難な実データを補うアプローチを提示しています。
- TVAE、CTGAN、CopulaGANの3つのタブular向け生成モデルを多目的最適化と自動ハイパーパラメータ探索で最適化し、統計的ベースラインとしてガウス・コピュラ(GC)を用いて比較しています。
- 合成データの評価は、現実性・多様性・運用上の妥当性・統計的類似性・忠実度・予測有用性の6段階で行われます。
- 結果として、最適化した生成モデルは非最適化版より優れ、実データのみで学習した場合に比べて転用予測が大きく改善することが示されています。
- 全体として、品質を制御した生成的増強によって航空交通におけるレアイベント予測を前進させられることを実証しています。




