セル単位の外れ値(Cellwise Outliers)
arXiv stat.ML / 2026/4/17
💬 オピニオンIdeas & Deep AnalysisModels & Research
要点
- この論文は、従来の「事例(ケース)単位の外れ値/異常」から、「データ行列またはテンソル中の個々の要素(セル)が逸脱する」セル単位の外れ値へと焦点が移っていることを示しています。
- 高次元では、比較的少ない割合の外れセルでも多数のケースが汚染され得るため、従来の事例単位の検出手法がうまく機能しないと説明しています。
- セル単位の外れ値の検出やセル単位で頑健な推定を行うには、事例単位の枠組みとは異なる発想・手法が必要であり、場合によっては直感的な共変性(エクイバリアンス)を手放す必要があると述べています。
- 本稿は、位置・共分散の推定、回帰、主成分分析(PCA)、テンソルデータ向け手法などに関する近年の進展を概観し、高次元データではセル単位アプローチが優勢になり、欠損値にも典型的に対応できる点を強調しています。



