繪圖處理器之執行緒區塊排程優化與其在CASLAB-GPUSIM上之實現

Translated title of the thesis: Optimization of Workgroup Scheduling on CASLAB-GPUSIM
  • 蔡 森至

Student thesis: Master's Thesis

Abstract

通用型繪圖處理器的應用日漸受到重視。而本實驗室以高階語言SystemC建立了基於Single Instruction Multiple Thread架構的通用型繪圖處理器模擬平台, CASLAB-GPUSIM,模擬平台也包含了子記憶體及軟體程式介面,並通過取自Rodinia、AMD和NVIDIA等的驗證程式。 此篇論文探討通用型繪圖處理器執行緒區塊排程的效能,提出Kernel Aware Warp Scheduler ( KWS ) 機制緩解其Kernel工作量使用硬體資源的不平衡,此機制需要在執行緒區塊排程配合使用Mixed Concurrent Kernel Execution,讓不同的Kernel執行在同個串流多處理器上,然後以Kernel和指令作為分類調整Warp優先權,藉此提升硬體使用率以改善效能。此篇論文亦提出Profiling Based Workgroup Scheduler (PBWS) 機制緩解Kernel需求與子記憶體資源不平衡。先使用靜態分析決定初始的執行緒區塊數量限制,再藉由動態分析逐步調整每個串流多處理器內部的執行緒區塊數量限制。最後將這些機制實做於CASLAB-GPUSIM平台上,並以實驗評估其硬體使用率的改善或快取記憶體命中的提升以及效能的提升。 總結此篇論文,當繪圖處理器同時執行一個Arithmetic-Intensive和一個Memory-Intensive的Kernel時,這時可以使用KWS機制提升效能約20%;當繪圖處理器只執行一個Kernel時,這時可以使用PBWS機制提升效能約11%。
Date of Award2017 Aug 17
Original languageChinese
SupervisorChung-Ho Chen (Supervisor)

Cite this

繪圖處理器之執行緒區塊排程優化與其在CASLAB-GPUSIM上之實現
森至, 蔡. (Author). 2017 Aug 17

Student thesis: Master's Thesis