獨家新聞辨識系統

Translated title of the thesis: An Exclusive News Identification System
  • 鄭 凱澤

Student thesis: Master's Thesis

Abstract

在網際網路盛行的時代,也改變了媒體傳播的方式及生態。資訊的傳遞更加快速,我們每天接受訊息的數量遠遠超過想像,面對如此海量的資訊令我們開始懷疑他們是否具有一定的內容品質,我們接收的到底是正確有用的或是所謂的垃圾訊息,正是我們面臨思考的問題。因此本研究提出一套系統方法來辨別新聞的獨家性,並可以讓使用者透過判斷新聞獨家性來思考新聞的真實性,此系統實做流程應用了google瀏覽器的開發技術進行特定網域之新聞搜尋、CKIP斷詞系統作為新聞標題關鍵字之萃取及搜尋所得之新聞內容斷詞以作為詞頻計算之使用、CURL過濾網頁內容以取得純粹之新聞內容、以及搭配Cosine Similarity演算法來進行新聞內容相似度比對。 本研究利用20筆人工判斷為獨家之新聞來進行系統訓練,然後以隨機瀏覽100篇新聞內容並判斷其為獨家來驗證本系統的準確率。從實驗結果得到判斷之準確度(Precision)為67%、取回率(Recall)為24%。從實驗數據中可推論出新聞內容因為同質性相近的關係會影響整體結果,當內容敘述同樣人事物但呈現不同事實時也會導致實驗結果相似。實驗過程中也因為比對到轉貼的內容而影響了獨家性的判斷。雖然結果還有改進空間,但本研究希望藉由探討判斷新聞文本的獨家正確性,能使?聽人對於?讀內容多作思考,並產生追求真相的想法,進而作為研究新聞文本真實性判斷的開端
Date of Award2016 Apr 21
Original languageChinese
SupervisorTzone-I Wang (Supervisor)

Cite this

'