摘要
在?多小數據學習問題中,由於資料結構不完整,決策者能獲得資訊有限。儘管機器學習算法被廣泛應用於萃取知識,但是大多數演算法建立於不考慮訓練資料集是否能夠完全代表母體的情況下所開發的。本研究著重於包含名目型輸入與連續型輸出的小資料集,發展了一種基於模糊理論的有效樣本產生過程,通過資料前處理解決學習問題。根據推導出的類別值和連續型輸出值之間的模糊關係,當給予連續輸出值時,可以獲得新類別組合(虛擬樣本)的可能性。接著透過可能性分佈使用模糊 進一步選擇適當的虛擬樣本,並將這些樣本添加到訓練資料集中以形成新的樣本。在該實驗中,使用倒傳遞類神經網路和支援向量迴歸來驗證從UCI機器學習資料庫取得的16個資料集。結果顯示,當建立新的訓練集時,兩種模型的預測精度得以顯著提高。此外,結果還表明,所提出的方法優於Bagging和SMOTE -NC,具有統計上顯著的支持。| 獎項日期 | 2019 |
|---|---|
| 原文 | English |
| 監督員 | Der-Chiang Li (Supervisor) |