Anomaly Detection은 말 그대로 데이터가 들어왔을 때 정상 데이터들의 특성을 통해 비정상 데이터를 탐지하는 것을 의미합니다. Anomaly Detection은 라벨 유무에 따라 크게 아래와 같이 나눌 수 있습니다.
1) Supervised anomaly detection
- 데이터셋에 정상 / 비정상 라벨이 있는 경우
2) Semi-supervised anomaly detection
- 라벨이 안된 다량의 데이터와 소량의 정상 / 비정상 라벨이 있는 경우
- 정상 데이터만으로 학습
3) unspervised anomaly detection
- 라벨이 아예 없는 경우
이번에 다루는 논문은 Deep SVDD 방법론을 제안하며 정상 데이터만을 학습하여 anomaly detection을 하는 semi-supervised 방식입니다
Introduction
Anomaly Detection (AD) 은 많은 정상 데이터를 통해서 비정상을 탐지하고자 하는 것입니다. AD는 사이버보안, 사기 검출 등 다양한 분야에서 적용되고 있습니다. 고전적인 AD 방법으로 One-Class SVM이나 Kernel density estimation 등이 있었는데 이는 고차원에서 좋은 성과를 내지 못했습니다. 또한 좋은 성과를 위해 feature engineering을 하는 부가적인 노력이 필요했습니다.
딥러닝을 활용하여 AD를 수행한 기존 연구들이 있었습니다. 특히 autoencoder를 사용했는데 이들은 어떤 AD 기반의 목적함수를 통해 학습한 것이 아니라 '재구축 오차'에 의존했습니다.
Deep Support Vector Data Description(Deep SVDD)는 kernel-based one-class classification과 minimum volume estimation 연구에 영감을 받아 진행되었습니다. Deep SVDD는 딥러닝을 기반으로 학습한 데이터의 feature space를 통해 정상 데이터를 둘러싸는 가장 작은 구를 찾는 것이 목적입니다. 그리고 이를 통해 이상치를 탐지합니다.
요약: neural network를 통해 input을 feature space로 mapping한 후, 해당 공간에서 대부분의 정상 데이터를 둘러싸는 가장 작은 구 경계를 찾는 방법으로 classification을 진행합니다.
Deep SVDD는 딥러닝으로 feature space를 학습하고 해당 feature space에서 정상 데이터를 둘러싸는 최적의 구(반지름이 작은)를 찾습니다. 목적함수는 정상 데이터의 feature space를 추출하여 각 데이터 point들이 구의 중심 c에 가깝게 mapping하게 합니다.
Hypersphere의 반지름을 최소화
hypersphere의 중심 c와 변환된 차원의 데이터 point 사이 거리를 최소화
weight decay regularizer(특정 가중치 w가 비정상적으로 커지는 것 방지)