利用可解讀式學習為關聯性研究選擇單核?酸多型性

  • 曾 郁婷

學生論文: Master's Thesis

摘要

近十年來,隨著次世代高通量定序技術的演進,DNA 定序所需花費的成本急遽下降,全基因組關聯性研究也得以日漸普遍,並成為理解各物種遺傳變化的最新途徑,尤其常見的研究方向是確認與疾病相關的單核甘酸多形性(Sngle-nucleotide polymorphism SNP)之間相互的作用,然而全部的 SNPs 總數十分龐大,全基因組數據在預測器的尺寸比樣本數大上?多,如此高維度的數據在分析與統計模型的建立上特別是一種挑戰。 在本研究中,我們提出一個可解讀式的學習方法,從高維度的基因組數據中過濾篩選出可能造成疾病的特徵,因?多疾病的發生都是由於多個變異位點相互作用而產生的,如何發掘與疾病相關之單核?酸多型性間的相互關係,是本研究主要欲討的議題。實驗結果表明,我們提出的分析方法應用在雜訊程度小於 10%的數據時,能夠在 10 個 SNPs 內找到真正與疾病有關連的 SNP,雜訊程度在 10%~15%時比起一般常見的卡方檢驗及 logistic regression 仍然能夠在更小的範圍中找出與疾病相關之具有 SNP-SNP interaction 的 SNPs,而在雜訊程度大於 15%後,本研究提出的方法就不具有優勢了,期盼本研究能讓未來的研究者在全基因組關聯性研究中對 SNP 間的關聯性檢測能有更佳的選擇。
獎項日期2016 七月 25
原文Chinese
監督員Tien-Hao Chang (Supervisor)

引用此

利用可解讀式學習為關聯性研究選擇單核?酸多型性
郁婷, 曾. (Author). 2016 七月 25

學生論文: Master's Thesis