現今國家時事已然影響了人民的生活型態,而這些影響則大多來自於民生物資取用的便利性及價錢的漲跌或是政治政策的實施及改變。這些政策事件的新聞發佈後,常常會引發一連串的相關文章或人民評論釋出到各大社群網站與新聞媒體網站,如Facebook、PTT等等。這些文章經過統整後,以情感分析、正負面分析等工具來分析後,再做出各類統計計算得出結論,以利決策者可以得知人民對於某人事物大多是怎樣的傾向,讓決策更能貼近民心,這就是常用到的輿情系統。不過,現今的輿情系統還是會有些?的限制,目前的輿情系統可以用一些自然語言處理方法計算出很多情緒值,像是開心、難過、生氣等等,但就是無法得知新聞文章裡對於文章內所提事件或議題到底是支持還是不支持。 本研究的目的在從新聞對於某事件的支持語句做配對及比較的語句相似度,試著分析此文章是否支持對應事件。研究方法使用孿生神經網路(Siamese Network)將一句短短的事件支持語句和一整篇事件新聞文章匹配在一起,使用長短期記憶神經網路(Long Short-Term Memory)並加入注意力機制(Attention Mechenism)導入孿生神經網路中,以解決兩個長短差距過大的語句差異問題。同時使用幾個不同的距離計算公式做比較,將兩個文本代表特徵做完整的匹配計算,訓練出分析事件支持度模型,以達成網路上所有有關某事件支持度正反面傾向之統計,讓決策者能更清楚的判斷民眾對於某事件的支持與否。 本研究主要以時事新聞事件資料,而這些資料中包含了?多中文專有名詞,所以語詞分割工具的選擇對於本研究的效果具有非常重要的影響。本研究將共計4112篇文章的新聞立場正反面傾向執行了人工標記,訓練詞彙用語資料庫有七萬多篇,驗證文章為300篇近幾個月的新聞時事。
獎項日期 | 2020 |
---|
原文 | English |
---|
監督員 | Tzone-I Wang (Supervisor) |
---|
Using Siamese Neural Network with Attention Mechanism to analyze the support degree of news events
宜澤, 李. (Author). 2020
學生論文: Doctoral Thesis