當前高效能運算領域中GPU用於非繪圖應用程式的加速。無論是平行演算法還是深度學習的應用,皆須利用GPU進行運算加速,也因此GPU的設計與實作對於運算系統的開發來說佔有重要的地位。然而開發GPU運算系統是個複雜的過程,必須兼顧硬體與軟體系統才能驗證整個運算平台,透過TLM方法能克服實現複雜系統的障礙,漸增式的開發流程將會先從高度抽象化的硬體模組著手,建構軟體系統的雛型,並在早期的開發階段進行軟硬體的整合驗證,之後再逐步實現更實際與低抽象層級的軟硬體系統。 時序精確為TLM所規範的一種抽象層級,需描述硬體模組在每個時脈邊緣時的行為。透過時序精確的規範,設計者得以根據硬體的?能性模組,開發更低抽象層級的硬體模組。本論文探討時序精確模組的設計方法,並且將此方法應用詳述GPU內部的時序精確SIMT核心設計。在本論文將討論基本時序精確模組的規範方法,分析與條列出SIMT核心架構上的?能需求,並且呈現微架構層級的硬體模組設計與效能指標。最後在CASLAB-GPUSim平台進行整合測試,分析效能指標並且探討效能瓶頸,以及比較其他低階運算系統效能差異,在平行化佳的測試程式能得到4 7到20 1倍的效能提升,而當GPU調升至1 2GHz時,GEMM能有52 6倍的效能提升。
獎項日期 | 2018 10月 26 |
---|
原文 | ???core.languages.zh_ZH??? |
---|
監督員 | Chung-Ho Chen (Supervisor) |
---|
時序精確SIMT核心設計與實作
基漢, 鄭. (Author). 2018 10月 26
學生論文: Master's Thesis