現今社群網站的崛起,人們可以輕易跨過地理的界線進行互動,相互討論感興趣的議題。而眾多社群網站中,以短文字訊息呈現的微網誌為市面上大家主要使用的社群類型。微網誌強調訊息的時間性和即時性,導致每天產生大量的訊息。使用者要如何從這大量的訊息中,迅速了解大眾關注的主題已經成為目前熱門的研究議題。現今主題偵測與追蹤(TDT)的技術,可以從大量文字資料中擷取出主題。然而過去TDT的技術專注於新聞資料集,其方法不適用於短文字且變化較多的微網誌上。此外,主題偵測的結果通常用一個字或一組字來代表主題,但主題會隨者時間而變化,此呈現方式過於簡單,難以讓使用者了解該主題的趨勢與追蹤整個主題事件的始末。 本研究的目的為幫助使用者快速了解目前網路社會上,大眾所關注的主題趨勢,並藉由本研究系統瀏覽主題相關資訊,來了解、追蹤事件的始末。為了達成本研究之目的,本研究系統運用文字分群與主題偵測的技術找出大眾關注的熱門議題,並有效的過濾雜訊。接著建立社群資訊的topic tree 讓使用者了解與發現主題間的關聯。經實驗後證實,本研究提出之分群與主題偵測演算法皆無需人工幫助便能自動化的處理大量網路訊息,其結果的F-measure高達0 6,並優於先前學者提出之研究。 最後將本研究方法獲得的主題相關資訊結合時間軸,建立成一個社群主題資訊系統,呈現出主題資訊與趨勢,讓使用者能夠迅速了解與追蹤整個主題的始末。
Date of Award | 2014 Jun 12 |
---|
Original language | Chinese |
---|
Supervisor | Hei-Chia Wang (Supervisor) |
---|
社群資訊主題偵測 - 以Twitter為例
靖傑, 黃. (Author). 2014 Jun 12
Student thesis: Master's Thesis