以主題偵測與追蹤建置階層式知識檢索方法

  • 吳 克松

學生論文: Master's Thesis

摘要

知識是企業重要的資產,隨著網際網路、資訊硬體設備快速的發展,儲存於系統中的非數據化知識越來越多且越複雜,導致使用者在利用傳統關鍵字查詢時,雖有找到符合的資料,但往往因為筆數過多、無法快速找到真正所需的資訊。面對這樣的資訊超載、無法有效檢索的窘境,主題相關的概念紛紛被提出應用,所謂的相關是指檢索詞彙與文章內文之間的一種吻合關係,雖然由主題的觀點來探討相關,較能滿足使用者的檢索需求,但大多是以全文為分析對象,忽略了文件特定部份的重要性,而且分析所得的主題多為單詞、不具關聯等特性。 為了協助使用者能更容易檢索所需資訊及了解相關主題,本研究提出建置階層式知識檢索的方法,以公司Notes資料彙辦系統的文件庫資料為資料集,針對案件主旨、說明欄位及附加檔案的文字,進行自然語言處理,利用詞彙加權等特徵選取組成文件向量,透過主題偵測與追蹤技術,依據文件之間的相似度,以二階段分群方法,建立階層主題關聯資訊,新進文件搭配分類方法,檢索結果依特徵詞彙權重排序,並以主題方式呈現,幫助使用者在面對大量資訊的同時,能快速檢索其所需的資訊,了解相關主題。 實驗結果證明,利用本研究方法的精確率為53 9%,相較於現行系統全文檢索的33 2%,精確率提高了二成。在整體表現上,本研究方法的F-measure為63%,也較現行系統的44 9%高出18 1%,顯示利用本研究的方法能改善檢索的成效。
獎項日期2015 8月 26
原文???core.languages.zh_ZH???
監督員Hei-Chia Wang (Supervisor)

引用此

'