用多項式簡易貝氏分類器分類基因序列資料時以遺傳密碼進行特徵萃取之研究

  • 林 修弘

學生論文: Master's Thesis

摘要

以往人類在探究環境微生物時都是先從環境中採集樣本,再放入實驗室進行培養研究。但是近年來科學家發現實驗室中的環境只能培養自然環境中百分之一的微生物,限制了研究範圍,因此直接取樣以進行基因定序的宏基因體學技術更適合用於研究微生物種群。在處理宏基因體學序列時,簡易貝氏分類器由於其良好的分類效果和線性的運算成本被廣泛採用。雖然簡易貝氏分類器在研究中已經取得了不錯的效果,但宏基因體學序列資料類別值多、屬性維度高且分佈稀疏的特點限制了其分類效果的進一步提升。為此,已有大量學者針對這一問題進行了深入的研究,提出了屬性選擇、階層式處理、先驗分配優化等方案。本研究針對這一問題,引入生物學中的遺傳密碼對序列資料進行處理,並且改進了屬性萃取步驟並提出了組合式特徵使用方法,希望能夠進一步提升簡易貝氏分類器處理宏基因體學序列資料時的準確率。實驗結果顯示本文提出的研究方法不僅在準確率上略有提升 還能夠顯著提升運算速度。
獎項日期2016 7月 14
原文???core.languages.zh_ZH???
監督員Tzu-Tsung Wong (Supervisor)

引用此

'