Project

[캐글] Detecting Anomalies in Wafer Manufacturing

https://github.com/khw11044/Detecting-Anomalies-in-Wafer-Manufacturing

GitHub - khw11044/Detecting-Anomalies-in-Wafer-Manufacturing

Contribute to khw11044/Detecting-Anomalies-in-Wafer-Manufacturing development by creating an account on GitHub.

github.com

목적: 웨이퍼 제조 과정에서 발생하는 불량을 탐지하는 프로젝트를 수행한다.

요약: 웨이퍼 제조 과정에서 측정된 다양한 기계 데이터를 수집하고 이에 따라 양품과 불량품, 2개의 클래스 0과 1로 구분된 데이터가 제공된다. 양품이 불량품 데이터보다 더 많은 불균형 데이터이며, 굉장히 많은 features들을 포함한 데이터 이다.

많은 features들을 처리하고 불균형된 데이터 문제를 해결하자.

About Dataset

해당 데이터는 인도의 주요 웨이퍼(반도체) 제조업체 중 하나의 데이터셋이다.

수집된 데이터셋에서 feature는 보안으로 인해 이름이 익명으로 처리되었으며, 이를 이해하려면 깊은 도메인 지식이 필요하다. 그리고 이는 1558가지 features들이 존재한다.

본 캐글 해커톤에서 AUC를 평가지표로 사용하여 anomalies를 올바르게 분류하는 ML/DL 모델 생성을 추구한다.

Dataset Description:

- Train.csv - 1763 rows x 1559 columns
- Test.csv - 756 rows x 1558 columns
- Sample Submission.csv - Please check the Evaluation section for more details on how to generate a valid submission

Attribute Description:

Feature_1 ~ Feature_1558 : 제조 기계에서 수집된 다양한 속성을 나타냅니다.

Class - (0 or 1) : 양품과 불량품 클래스 라벨을 나타냅니다.

Skills :

High Dimensionality Data, Overfitting-vs-Underfitting

Advanced Classification Techniques, Gradient Boosting, Neural Nets, etc

Feature engineering, Feature Selection Techniques

Optimizing Area under the curve(AUC) to generalize well on unseen data

Contents

AboutDataset

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

새소식

인기 검색어

[캐글] Detecting Anomalies in Wafer Manufacturing

About Dataset

당신이 좋아할만한 콘텐츠

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역