建立一個新的虛擬樣本產生技術學習小樣本資料

  • 凌 偉珊

學生論文: Master's Thesis

摘要

由於網路世代的興起,資訊傳遞快速且更多元,大數據成為這幾年最熱門的討論話題,很多學者提出不同面向的研究,除了大數據問題外,數據缺乏的小樣本問題也常在日常周圍發生,例如新產品導入工程階段、新機台新製程參數制定、傳染病的流行、毀滅性災難的發生、預估氣候變化等,歸納以上的問題都有一些共通的特性,像是資料取得不容易或者取得成本過高,導致讓專家難以做進一步相關的分析與預測。因此在數據缺乏的情況下,如何從取得不易的資料中擷取出更多有意義的資訊提供參考,在近幾年已成為另一個研究的議題。 而虛擬樣本產生法已被驗證是一種有效解決小樣本問題的方法,其中主要的技術為整體趨勢擴散法(Mega-trend diffusion MTD),其主要的定義是假設資料是一個單峰的分佈並考量偏態的狀況,但真實的資料母體分佈可能為多峰態型態,且資料分佈並非都是簡單分佈。為了解決以上所提到的問題,本研究提出一個無母數多峰態虛擬樣本產生法,利用軟性DBSCAN群集法先對小樣本的數據做資料的前置處理,從中擷取出最大量且有用的前處理資訊,接著利用MTD演算法估計每群資料的範圍,藉以產生虛擬樣本提供後續資料預測時使用。
獎項日期2016 八月 3
原文Chinese
監督員Der-Chiang Li (Supervisor)

引用此

建立一個新的虛擬樣本產生技術學習小樣本資料
偉珊, 凌. (Author). 2016 八月 3

學生論文: Master's Thesis