晶圓切割之不平衡資料集的分類

Translated title of the thesis: Classification of the Imbalanced Data Sets Collected from Wafer Sawing
  • 郭 皇志

Student thesis: Master's Thesis

Abstract

晶粒為該晶圓切割工作站點之重要產出,本研究目的欲利用後製程的晶圓光學檢測結果,建構前製程切割工作站點預測模型,探討晶圓切割過程中產生缺點模式『破刀』的主要因素。檢視收集的兩個月製程資料,發現母體晶圓樣本數為52 651筆,而晶圓破刀樣本數為342筆,多數類別樣本數約略為少數類別樣本數的154倍,故此為典型不平衡資料集。本研究以資料探勘分類方法建構分類預測模型並比較,使用決策樹、K最鄰近法、RIPPER分類規則三種分類演算法針對不平衡資料集建立分類模型,計算所得其召回率、精確率、F度量值來評估該演算法對於少數類別正確分類能力。 決策樹,具有易於整理以及高可讀性的分類規則特性,面對不平衡資料集時,容易受多數類別影響造成分類結果的偏頗,故經由SMOTE抽樣方法將多數與少數類別比例趨於平衡,雖然抽樣對資料集之影響,但得出的分類規則於製程中仍有參考意義;RIPPER演算法,係參考原資料結構而產生對應的分類規則,面對不平衡資料集時,優先從少數類別開始學習,也具有易於整理以及高可讀性的分類規則特性,RIPPER本研究中於少數類別精確率為0 7174,表示預測『破刀』的少數類別情形有71 74%的正確率;K最鄰近法,係參考原資料結構於特徵空間距離而產生的分類結果,較能反應真實資料特性,求得F度量值並作為演算法比較參考基準點,評估該不平衡資料集的分類預測程度。 本研究經由RIPPER與決策樹模型得出分類規則結果,對找出少數類別『破刀』可歸納為三類的重要特徵,分別以機台機件及訊號相關特徵、刀刃相關特徵、晶圓材料特性探討。可應用於製程中的參數即時監控,正確預測破刀問題發生的時機,改善製程上的晶粒品質產出,並減少成本的浪費。
Date of Award2018 Jul 19
Original languageChinese
SupervisorTzu-Tsung Wong (Supervisor)

Cite this

晶圓切割之不平衡資料集的分類
皇志, 郭. (Author). 2018 Jul 19

Student thesis: Master's Thesis