美食文章名稱實體辨識方法之研究

  • 黃 品瑞

學生論文: Master's Thesis

摘要

隨著生活型態逐漸精緻,美食觀光成為近年來熱門的現象,而近年來台灣美食小吃逐漸在國際受到矚目,甚至有?多外國觀光客為此慕名而來。而在決定享用那些美食之前,?多人會依其它人的建議去選擇。在WEB2 0的社群平台當中,部落格擁有豐富的美食相關資訊以及知識,這些有關美食的意見分享以及資訊交流,成為?多人在做決策時的參考依據。 此外,行動裝置的發展,讓地理資訊系統(Geographic Information System GIS)以及相關的在地化服務(Location Based Service LBS)隨之而生,?多使用者會利用所在地理位置來查詢需要的資料。但在查詢部落格文章時,常常因為螢幕大小的限制導致使用者在?讀上的不便。因此,如何快速地從文章中獲得重要的名稱實體成為一個值得研究的議題。 因手持設備顯示的限制,需將資料精簡且準確的選出重要資訊。然而,常遇到的問題是因為擷取錯誤的用詞,導致資訊不夠精確。而過去?多研究為了改善此狀況,嘗試從這些複雜且非結構化的部落格文章中找出文章中的重要字詞。因此,名稱實體辨識(Name Entity Recognition NER)成了重要工作。獲得名稱實體後,另一工作是判斷作者對特定美食的評價意見,此為意見探勘(Opinion Mining)的應用。 綜上所述,本研究設計一NER的方法,透過觀察文章寫作習慣以及搜尋引擎的幫助,提高美食文章的?廳名稱實體擷取準確度。並利用資料集中美食名稱斷詞後的特徵字詞,加上搜尋引擎的篩選,重組找出文章中的美食名稱。接著將美食名稱和意見字詞對應,形成成對資訊]。最後,透過文章中的地址資訊轉換後的經緯度地理訊息,建立一個美食地圖,將結果呈現給使用者,作為找尋美食的參考依據。
獎項日期2014 六月 18
原文Chinese
監督員Hei-Chia Wang (Supervisor)

引用此

美食文章名稱實體辨識方法之研究
品瑞, 黃. (Author). 2014 六月 18

學生論文: Master's Thesis