隨著資訊系統在企業越來越普及與重要,專門處理資訊相關問題的Help Desk人員也對企業的工作效率有重大的影響,然而企業對於Help Desk的重視依然保守,為了減低Help Desk高流動率的負面影響以及提升企業工作效率,對於企業現有的User Help Desk問題利用文字分析方法來處理系統的歷史處理問題紀錄集來挖掘有價值、可重複使用的資訊是企業值得投入的。 因在傳統的關鍵字查詢結果不是不夠精準就是相同語意但不同用詞的語意問題,使得查尋條件太難設定,為了分析語意關連問題,本研究採用E-HowNet語意知識庫來轉換中文詞彙之語意關係,再使用主題模型LDA(Latent Dirichlet Allocation)方法來找出每篇文章所代表的主題,依題來將相似的問題聚集起來,取出這些問題的回答紀錄進行分群並萃取摘要,並依主題關連性依序呈現給使用者,經實作驗證後,轉換語意時加入完整詞性之篩選比無語意處理提升Precision約8 5%,而用LDA訓練好的主題模型取出相同主題之問題來計算,雖然Precision從99%降為92%,但花費時間可縮短為原本的1/34,而本研究文集屬於短文集,因此句子關聯度門檻值不宜設太高避免摘要萃取失敗,建議值為0 05,此外還發現AP Cluster分群之摘要效果比K-means好。
Use Semantic Analysis to Improve the Performance of Help Desk Problems
正煌, 陳. (Author). 2019
學生論文: Doctoral Thesis