修正整體趨勢擴散技術於小樣本之學習

Translated title of the thesis: Improving the mega-trend-diffusion technique for small data set learning
  • 蕭 亮仁

Student thesis: Master's Thesis

Abstract

基於產品汰換速度加快腳步,自眾多試製樣本中抽取出合適的製程參數並依此對現有機台進行調整的思維已逐漸因邁入客製化型態-少量多樣的生產模式而不再適用,如何從樣本數不適用於足夠學習的情境下成為一個不容忽視的小樣本問題。小樣本問題在於樣本數始終都是母體的極小一部分,同時樣本彼此間存在著資料間隙,現有統計方法無法系統性地解決上述問題。整體趨勢擴散技術藉由填補資料間隙並利用母體值域估計技術對資料行為進行預測,並於其中產生虛擬樣本及其對應隸屬函數值以建構適用於小樣本的類神經網路。 然而母體值域估計模型的參數選定仍有著下列問題:偏態係數僅由中心點兩側個數來決定,使不同母體來源的小樣本卻推論出相同母體分配;整體趨勢擴散係數造成過度擴散推論母體分配範圍,讓產生的虛擬樣本可能不符潛在母體特性;原先利用組中點概念對擴散中心點進行定義,於該點附近不一定存在實際樣本等。本研究探討上述缺點並尋求改善方案,加入可能性評估機制重新建構類神經網路,補足原先技術中未能詳加考慮的部分。經兩筆分類案例驗證後發現本研究的確可以在有效縮減擴散範圍前提下有著更好的穩健性,同時亦不因縮減擴散範圍使得準確度下降過多,進一步呈現不同母體來源的樣本在新修正模型參數底下推論出不同母體分配的情形。
Date of Award2015 Aug 25
Original languageChinese
SupervisorDer-Chiang Li (Supervisor)

Cite this

'