해당 논문을 간단하게 보고 해당 논문과 데이터를 바탕으로 제공된 캐글 데이터를 분석해본다.
https://www.kaggle.com/datasets/qingyi/wm811k-wafer-map/data
논문 : Wafer Map Failure Pattern Recognition and Similarity Ranking for Large-Scale Data Sets
https://ieeexplore.ieee.org/document/6932449
Abstract:
Wafer maps은 엔지니어가 wafer pattern 오류의 원인을 식별하는 데 도움이 되는 세부 정보를 제공하는 특정 오류 패턴을 나타낼 수 있다.
Wafer maps에서 엔지니어는 wafer pattern 오류의 원인을 식별하기 위해 특정 오류 패턴을 분석하여 세부 정보를 제공받는다.
wafer map failure pattern recognition (WMFPR)과 wafer map similarity ranking (WMSR)의 기존 접근방식들은 일반적으로 raw wafer map data를 적용하는 것 (즉, feature 추출을 수행하지 않은것)을 포함한다.
그러나 반도체 제조 과정에서 점점 더 많은 센서 데이터가 사용되고 이를 분석하기 때문에 현재 사용되는 접근 방식은 대규모 데이터 세트를 처리하는 데 부적절할 수 있
따라서, wafer maps의 reduced representation을 얻기 위해 새로운 rotation and scale invariant features 세트가 제안되었다.
이런 features들은 WMFPR와 WMSR를 사용하여 대규모 데이터 세트를 분석할 때 중요하다.
본 논문에서는 제안된 시스템의 성능을 검증하기 위해 811,457개의 실제 웨이퍼 맵으로 구성된 세계 최대의 공개적으로 액세스 가능한 웨이퍼 맵 데이터 세트를 구축하였다.
실험 결과는 제안된 기능과 전체 시스템이 대규모 데이터 세트를 효과적이고 효율적으로 처리하여 현재 반도체 제조 요구 사항을 충족할 수 있음을 보여준다.