基於機器學習方法之微型核糖核酸目標基因預測

Translated title of the thesis: Machine Learning Based MicroRNA Target Prediction
  • 朱 柏勳

Student thesis: Master's Thesis

Abstract

辨別微型核糖核酸(microRNA)結合的目標基因是研究基因抑制作用的基礎。現今已經有很多預測器,而基於機器學習的預測器更是大幅的提升了預測的效能。對於基於機器學習的預測器來說,負資料集的使用卻仍是一個困難的議題,由於並沒有專門在辨認非目標基因的系統,所以目前基於機器學習方法的的預測器多半是使用自己產生的負資料集作為訓練資料集,而不同生成的方法也會對機器學習演算法帶來不同的效果。機器學習的另外一個要點即是特徵的使用,在本論文中我們將使用一般經驗法則下有用的特徵如互補的種子區域(seed matching region)、結合體熱力穩定性(thermodynamic stability of duplex)…等,並且加入一些新型特徵(de novo feature),如序列模式特徵-兩兩核?酸(Bigram)以及本研究所提出使用的三三核?酸(Trigram)特徵。而由於機器學習演算法建立的模型通常較為複雜,人類通常無法直接解釋模型學習到什麼,因此我們使用規則提取的演算法從預測器中提取出基於經驗法則特徵以及新型特徵的規則。 在本研究中我們與幾個現行的預測器比較,取得了很高的ROC AUC分數,其中分析了不同製作方法的負資料集所帶來的影響,並且根據不同的狀況,我們提出一個如何準備負資料集的方法。在機器學習的架構上,為了讓結合的判定更加嚴苛,我們結合了多種不同性質的機器學習演算法,並且使用調和平均數對所有演算法的結果進行平均,藉以得到更穩健的預測。
Date of Award2017 Jul 14
Original languageChinese
SupervisorTien-Hao Chang (Supervisor)

Cite this

基於機器學習方法之微型核糖核酸目標基因預測
柏勳, 朱. (Author). 2017 Jul 14

Student thesis: Master's Thesis