Initial Model Study of Speech Emotion Recognition Using Hidden Markov Model Based System

論文翻譯標題: 基於隱藏式馬可夫模型之語音情緒辨識的初始模型探討
  • 黃 俊修

學生論文: Doctoral Thesis

摘要

語音情緒辨識在人機互動領域上是最重要的主題之一,可以應用在聊天機器人、心理檢測、安全提醒等等情境。近幾年,已嘗試過非常多不同的特徵及分類器,例如,音高、共振峰、梅爾倒頻譜係數這些特徵以及支援向量機、高斯混和模型、隱藏式馬可夫模型、類神經網路等等分類器。 語音情緒可視為一段語氣的狀態變化。在本研究中,基於此論點以高斯混和模型、離散隱藏式馬可夫模型、連續隱藏式馬可夫模型作為分類器並選用梅爾倒頻譜係數作為特徵的辨識率結果做出一個完整的比較,並得出使用狀態變化機率的隱藏式馬可夫模型優於使用統計資訊做分類的高斯混和模型,以及使用多維機率密度函數的連續隱藏式馬可夫模型優於使用離散機率的離散隱藏式馬可夫模型。 上述系統存在的下溢位及奇異性問題,也會在本論文討論及提出解決方法。再者,關於隱藏式馬可夫模型中初始模型假設的討論也會在本論文提出。 最後,最高的辨識率分別以高斯混和模型、離散隱藏式馬可夫模型、連續隱藏式馬可夫模型作為分類器的結果分別為,58 07%、65 67%、89 20%。而最高的平均辨識率分別以高斯混和模型、離散隱藏式馬可夫模型、連續隱藏式馬可夫模型作為分類器的結果為,51 12%、53 20%、70 15%。辨識率結果顯示出連續隱藏式馬可夫模型這三者中辨識率最好的分類器。
獎項日期2019
原文English
監督員Lih-Yih Chiou (Supervisor)

引用此

'