以虛擬樣本產生法為基礎的隨機林預測模式

Translated title of the thesis: Accomplishing Random Forest on the Basis of Virtual Sample Construction
  • 陳 弘基

Student thesis: Master's Thesis

Abstract

如何將資料轉換為有意義的資訊,以提供予企業決策者以為參考,具有其實質上應用的價值。在過往針對分類資料的學習問題上,為了改善單一模式之分類正確率而有著如裝袋法、激發法、以及隨機林等整合分類學習程序,然而此些方法在建構子模式時,其所需的子樣本集資料係藉由拔靴法生成,使得此些子模式只能針對相似的資料從事重覆性的訓練,並產生出僅具些微差異的學習結果,雖能改善單一模式的分類準確度,而其結果仍屬有限。為使子模式能夠針對非訓練的樣本資料範圍進行學習,本研究使用虛擬樣本取代拔靴法,並選擇以整體趨勢擴散技術(mega-trend-diffusion MTD)來進行子樣本集的生成,此種虛擬樣本產生法於近十年的研究中,已被確認能有效增進學習工具對於少量樣本的訓練穩定性以及預測準確度。於資料取得方面,本研究使用公開資料庫UCI上所取得之資料,針對隨機林整合分類法,將拔靴法改使用MTD進行測試,冀能增進隨機林對於測試樣本的分類準確度。實驗結果顯示,本研究之方法能有效提升分類正確法之準確率。
Date of Award2014 Jun 20
Original languageChinese
SupervisorDer-Chiang Li (Supervisor)

Cite this

以虛擬樣本產生法為基礎的隨機林預測模式
弘基, 陳. (Author). 2014 Jun 20

Student thesis: Master's Thesis