時序精確SIMT核心設計與實作

  • 鄭 基漢

學生論文: Master's Thesis

摘要

當前高效能運算領域中GPU用於非繪圖應用程式的加速。無論是平行演算法還是深度學習的應用,皆須利用GPU進行運算加速,也因此GPU的設計與實作對於運算系統的開發來說佔有重要的地位。然而開發GPU運算系統是個複雜的過程,必須兼顧硬體與軟體系統才能驗證整個運算平台,透過TLM方法能克服實現複雜系統的障礙,漸增式的開發流程將會先從高度抽象化的硬體模組著手,建構軟體系統的雛型,並在早期的開發階段進行軟硬體的整合驗證,之後再逐步實現更實際與低抽象層級的軟硬體系統。 時序精確為TLM所規範的一種抽象層級,需描述硬體模組在每個時脈邊緣時的行為。透過時序精確的規範,設計者得以根據硬體的?能性模組,開發更低抽象層級的硬體模組。本論文探討時序精確模組的設計方法,並且將此方法應用詳述GPU內部的時序精確SIMT核心設計。在本論文將討論基本時序精確模組的規範方法,分析與條列出SIMT核心架構上的?能需求,並且呈現微架構層級的硬體模組設計與效能指標。最後在CASLAB-GPUSim平台進行整合測試,分析效能指標並且探討效能瓶頸,以及比較其他低階運算系統效能差異,在平行化佳的測試程式能得到4 7到20 1倍的效能提升,而當GPU調升至1 2GHz時,GEMM能有52 6倍的效能提升。
獎項日期2018 10月 26
原文???core.languages.zh_ZH???
監督員Chung-Ho Chen (Supervisor)

引用此

'