隨著網路與科技的進步,線上音樂平台與串流音樂蓬勃發展,大量的數位音樂使得使用者面臨資訊過載的問題。為了解決這個問題,這些平台需要利用使用者資訊與輔助資料來建構完善的推薦系統,協助使用者檢索、查詢或發現新的音樂,目前最常用來查詢的方法是使用關鍵字查詢。 關鍵字的查詢中,社交標籤(social tag)被認為能夠幫助推薦系統進行更完善的推薦,然而社交標籤卻面臨標籤稀疏性以及冷啟動(cold start)的問題,使得其幫助推薦系統的成效受限。為了解決這些問題,需要透過自動標籤(auto tagging)系統來補足標籤的不足,達到協助推薦系統的?能。過往的自動標籤的研究中,大多僅使用音頻來進行分析,然而已有?多研究證明了歌詞能夠幫助音樂分類系統取得更多資訊並且提升分類正確率。因此本研究將歌詞納入分類系統中與音頻共同進行特徵擷取,提出一個混合音頻與歌詞的音樂自動標籤系統。 近年來,由於類神經網路的發展,已有不少學者使用類神經網路來進行音頻以及文字特徵的擷取,並也證實其成效。其中,針對歌詞特徵擷取的部分,有不少研究指出考量歌詞的架構能更有效的提取歌詞特徵來完成分類任務。本研究將使用類神經網路的架構來進行音樂的特徵擷取以及自動標籤,針對歌詞特徵擷取,本研究將混合卷積神經網路(convolutional neural network)及循環神經網路(recurrent neural network)的架構進行特徵擷取,以達到擷取歌詞架構特徵的目的。 此外已有研究證實,使用多目標學習的方法能夠藉由學習標籤之間的關聯性達到提升分類表現的目的。本研究將多目標學習的方法應用於歌曲自動標籤之中來進行標籤分類。 經過本研究實驗證實,本研究透過混合音頻與歌詞來進行歌曲自動標籤並且以多目標學習的標籤分類器完成分類任務的方法,比起先前研究中只使用音頻的單目標學習方法有更好的分類表現。
A Method of Music Auto-tagging Based on Audio and Lyric
陞瑋, 徐. (Author). 2019
學生論文: Doctoral Thesis