The Impact of Linear Transformation on the Effectiveness and Security of the Privacy Preserving Data Mining Process

論文翻譯標題: 探討線性轉換方法對隱私保護資料探勘流程效用及安全性影響之研究
  • 方 荷雅

學生論文: Doctoral Thesis

摘要

由於資料探勘技術能夠從資料中提取有用的知識,以便更好地了解和服務客戶,從而獲得競爭優勢,因此在資料探勘這一領域也越來越多人投入及研究。而隨著資訊技術的發展,使得購物習慣、信用記錄、疾病歷史等個人資料都能夠被收集和處理。毫無疑問,這些資訊對於?多領域都非常有用。然而,目前大眾對個人隱私的關注越來越大,?多人並不希望自己的私密資料被透露出去,所以保障資料的安全性又能夠透過資料探勘取得有效的資訊,在現今是一項需要被思考的事。故本研究嘗試建立一套方法流程,保障原始資料的私密性及效用性,期望對隱私保護資料探勘這塊領域有所貢獻。 目前隱私保護資料探勘這一領域,除去加密和匿名化,大多以對資料進行擾動來保護資料隱私,而擾動會導致資料失真,降低資料的效用性,因此本研究使用一段和多段式線性函數,將原始的連續型資料轉換成另一種數值,確保原始資料值不被直接得知,又能夠讓資料維持原本的效用性,再透過模型還原和預測程式的方法,使得資料接收者能夠使用自己的資料來做新資料預測。除了轉換資料集之外,還加入對轉換資料集的噪音干擾及加密的方式,使得在資料集的傳遞過程中,達到加強資料安全性的效果,讓第三方(非資料提供或接收者)無法使用此轉換的資料集。依據實驗結果可以發現決策樹及規則分類,使用多段式線性轉換能夠保持資料的效用性,提供比一段式轉換還高的安全性,並且分段數越多,安全性就會越高;羅吉斯迴歸和支持向量機則是使用一段式轉換即可,因為一段式轉換能夠維持資料的效用性,並且根據本研究的流程與評估方式,一段式轉換並不會對這兩種分類方法的安全性造成影響。
獎項日期2020
原文English
監督員Tzu-Tsung Wong (Supervisor)

引用此

'