近年來機器學習這項學門不斷的進步與發展逐漸深入人類日常生活,在不同的研究領域都能運用此項技術,機器學習最重要的元素可分為兩個部分,其一為學習的演算法,其二則為大量的資料集。有賴於現今科技發展,各式各樣的資料集不斷的產生,然而隨著資料集的量級快速成長,為了從中萃取出關鍵的資訊,特徵選取(Feature Selection)這項技術便應運而生。特徵選取包含了數種不同形式的應用,大致可分為過濾器(Filter)與包裝器(Wrapper)兩類,對於過濾器本身又可分為監督式(Supervised)與非監督式(Unsupervised)兩種不同的分析方式,在過往的研究中為了穩健的效能大多使用過濾器搭配包裝器的組合,然而其中過濾器往往僅使用單一的分析方式,因此容易因資料集或是演算法特性的不同而有效能上的偏差。 本研究提出一個嶄新的整合式特徵選取框架,此框架透過使用監督式與非監督式方法同時進行不同角度的分析,並使用循序前饋式浮點選取法(Sequential Floating Forward Selection)將兩類的結果混合,此框架在本研究中實際結合五種不同類型的預測器,並應用於十二種不同量級的資料集,結果顯示藉由整合不同方法進行完善的分析在主流的預測器中能有效的萃取出關鍵資訊並提升效能。
Date of Award | 2017 Jul 13 |
---|
Original language | Chinese |
---|
Supervisor | Tien-Hao Chang (Supervisor) |
---|
整合監督式與非監督式分析之特徵選取框架
璿衞, 楊. (Author). 2017 Jul 13
Student thesis: Master's Thesis