藉由盒鬚圖產生之虛擬樣本提升拔靴集成法的分類正確率

  • 陳 誌瑋

學生論文: Master's Thesis

摘要

如何將資料轉換成有意義的資訊,統計理論在過往扮演著重要的角色,然囿於其基本假設限制,已無法因應現實世界中各種不同面向的資料,因此類神經網路以及資料探勘等機械學習方法於近二十年來有著長足的蓬勃發展。其中在分類問題方面,相較於單一分類器的學習程序,集成法的提出可以有效減少過度配適問題的發生,如拔靴集成法、多模激發法等,其藉由拔靴法生成多個子訓練樣本集以建構多個子分類器,並將結果進行整合,雖能增進單一分類器的分類正確率,但其改善效果仍屬有限,乃因此些子分類器係針對屬性值與訓練樣本相同的子訓練樣本集進行重複性的學習之故。為使子分類器能夠對拔靴樣本以外的屬性值進行學習,本研究採用盒鬚圖進行訓練樣本的值域推估並藉以生成虛擬樣本以充實子訓練樣本集。本論文使用公開資料庫UCI上所取得之資料進行測試,經取得之資料集實驗證實,本研究之方法確能有效提升拔靴集成法之分類正確率,並能增進其分類方法的穩定性。
獎項日期2014 六月 25
原文Chinese
監督員Der-Chiang Li (Supervisor)

引用此

藉由盒鬚圖產生之虛擬樣本提升拔靴集成法的分類正確率
誌瑋, 陳. (Author). 2014 六月 25

學生論文: Master's Thesis