近年來,多媒體檢索的相關技術受到?多研究人員的重視。隨著網路時代的演進,多媒體平台的興起,造成多媒體資訊量成長快速,巨量的多媒體資訊造成資訊超載的狀況越發嚴重,因此多媒體平台需提供更加快速且準確的檢索方式來因應相關問題。現今多媒體資訊的檢索方式大多採取標籤方式,由多媒體擁有者提供標籤來加速搜尋效率、精準搜尋結果。但標籤資訊檢索時有機率會因擁有者的主觀意識影響結果,且當標籤資訊過於簡單或者標籤資訊與內文不符時,導致使用者無法正確且快速的找到資訊。影片摘要是多媒體檢索的方法之一,透過此方法可快速了解影片重點,因此使用者可更完整且快速的檢索影片資訊。 由於文字?讀效率高於?讀影片,故本研究嘗試提出一個系統,以文字自動摘要方式實現影片摘要。文字?讀的效率高於觀賞影片,故本篇研究採用文字摘要作為多媒體檢索的方式。文字自動摘要屬於自然語言處理的眾多研究之一,目的是從文本中擷取重點。近年來,深度學習應用於文字摘要,使文字摘要的研究獲得大幅度的進步。深度學習透過大量的訓練資料進行學習,將學習好的模型運用在文本上取得重點。本研究使用BERT(Bidirectional Encoder Representations from Transformers)模型,BERT是近年來較熱門的深度學習方法。?多研究指出BERT應用於自然語言上都獲得不錯的成績。BERT經由大量的語料訓練產出預處理模型,預處理模型擁有基礎的語言能力,預處理模型經過微調訓練獲得摘要模型。 本系統將影片轉檔後產出文字檔,再使用已訓練完成的摘要模型取得文本摘要。最後以主觀評論方式評比摘要,在摘要的接受度、完整性都有取得不錯的成績。
Filtering Videos By the Text Summarization technique based on BERT Model
?銘, 夏. (Author). 2020
學生論文: Doctoral Thesis