EOS: Controllable Entity-Oriented Summarization

論文翻譯標題: 控制實體導向之摘要生成
  • 林 雨瑩

學生論文: Doctoral Thesis

摘要

雖然文本摘要一直都是自然語言處理領域中一項重要任務,但對文本摘要進行客製化仍是較新穎的一項課題。根據客製化的需求目的不同,我們將客製化摘要分為五大類型:長度控制(length-constrained)、類別導向(aspect-oriented)、實體相關(entity-centric)、部份摘要(remainder)與文本風格(source-style)。我們於本論文提出一個新的實體導向摘要任務 (Entity-Oriented Summarization EOS) ,結合了以往類別導向及實體相關的目標,希望能夠生成以實體為導向的相關摘要。 現行的方法在進行實體導向摘要任務時,會遇到以下三個難題:缺乏與實體相對應的摘要訓練資料、罕見實體的向量學習表現不佳以及實體與文章主題不相關。面對第一個難處,前人往往自定義規則來產生對應的訓練資料,而我們在模型架構設計上,只需要一般的摘要作為訓練即可。對於罕見字處理,我們基於點間互資訊 (Pointwise Mutual information) 設計了一個新的相關度計算方式。而最後,我們採用一個模型訓練技巧,巧妙地在實體與文章不相關時,依然可以產生通用的摘要。實驗結果顯示,我們的模型確實可以產生與實體相關的摘要,而在進一步的分析中也可以發現,我們所提出的解決方法,確實能有效減緩罕見與不相關實體的問題。
獎項日期2021
原文English
監督員Hung-Yu Kao (Supervisor)

引用此

'