探討類神經網路模型超參數在小型且非原始特徵資料上的影響: 以信用評分資料為例

Translated title of the thesis: Exploring neural network hyperparameters on small dataset and hand-crafted features: take credit scoring as an example
  • 王 秉民

Student thesis: Master's Thesis

Abstract

近幾年,金融科技帶來傳統銀行業的變革,行動支付、貸款申請、投資理財、保險證券等各項業務,都開始展現出結合新資料技術的應用方式。而人工智慧的發展更是在這波浪潮下主要的推手之一,透過機器學習提升數據資料的應用價值,進而提供更精確、優質且快速的服務。而在借貸的環節中,信用評分是一個有效的工具幫助銀行或者放款人區分一個貸款者是否值得放款。 在過去,有?多的學者應用統計、資料探勘或者是機器學習的技術來提升模型的準確度,然而,因為銀行資料有其機密性,所以很少有公開的資料庫可供學者們研究 。也因為如此,在文獻上,大部分都是對於哪一個模型在信用評分上得到較好的準確率,或者是模型參數的調整,特徵的研究也因為資料庫的限制而鮮少有人探討。 本研究主要使用類神經網路作為信用評分的模型、選擇德國信用評分資料庫 (UCI german credit dataset) 當作資料的來源。我們參考近幾年深度學習發展所提出新的技術來修改在信用評分文獻中訓練類神經網路的方法,我們對正則項 (Regularizar) 做比較,此外,我們更探討了類神經網路的參數的起始值 (initialization) 跟激活函數 (activation function) 在此類型資料庫下的影響。而在調整超參數的過程,因為傳統網格式搜尋的方法對於類神經網路來說成本太高,所以我們使用貝氏最佳化 (Bayesian optimization) 的方法來調整網路的超參數,降低了一半的計算量。最後,我們將結果套用在澳洲信用資料庫上,也得到了比文獻中更好的結果。
Date of Award2018 Jul 18
Original languageChinese
SupervisorTien-Hao Chang (Supervisor)

Cite this

'