SECNet: Unsupervised Text Summarization Using Salience Extractor with a Consistent Network

論文翻譯標題: 基於顯著性提取器和一致網路之非監督式文本摘要模型
  • 顏 宏峻

學生論文: Doctoral Thesis

摘要

基於自動提取的文檔摘要是一項重要且困難的自然語言處理任務,尤其是在無監督式的摘要中。以前的非監督式摘要模型通常使用基於圖的排序算法來計算句子之間的相似性,藉此評估句子的顯著性。然而,相似性僅捕獲句子之間的表面關係。最近在非監督式的圖像生成和基於注意力機制的圖像標題模型方面之研究受到啟發。我們提出了一種基於注意力機制的非監督式摘要模型來解決上述問題。我們的模型包含兩個Seq2Seq模型,顯著性提取器和一致網路。顯著性提取器模型是用編碼器提取文檔的信息,並用解碼器生成潛在的摘要。通過潛在摘要的注意力分數,我們可以計算出每個句子在文檔中的重要性。一致網路是確保潛在摘要包含文檔信息。我們在英文摘要上準備了DUC 2001和DUC 2002兩個資料集以及中文摘要資料集LCSTS。另外我們還創建了一個中文財經新聞資料集,並由一組銀行審計專家標記參考摘要。
獎項日期2019
原文English
監督員Jen-Wei Huang (Supervisor)

引用此

'