移植Tensorflow至CASLAB-GPUSIM模擬平台與矩陣函式庫優化

  • 蘇 郁翔

學生論文: Master's Thesis

摘要

隨著雲端計算的蓬勃發展,機器學習的應用也逐漸拓展到終端裝置的應用上,為了能夠在終端硬體之開發階段或是終端應用的效能分析,本論文整合了機器學習框架Tensorflow與本實驗室所開發的OpenCL Runtime,成?將Tensorflow Runtime移植至本實驗室所開發的CASLAB-GPUSIM模擬平台上,接著又透過以Tensorflow所撰寫的測試程式進行了一系列的系統驗證,借此模擬終端裝置上的機器學習應用情境。 除了終端機器學習模擬平台的搭建,本論文認為在以通用繪圖處理器作為終端加速的解決方案中,線性代數的函式庫並沒有隨著該應用情境以及計算資源而有所變化,其中尤以矩陣乘法影響最甚,因其為建構卷積神經模型之卷積層與全連結層的基本運算單元,有鑑於此,本論文針對CLBlast函式庫的矩陣乘法演算法提出了優化建議,亦即針對終端機器學習應用的運算型態減少矩陣乘法函式庫的前處理以達到減少整體矩陣乘法函式庫所需要的執行時間。
獎項日期2018 十一月 21
原文Chinese
監督員Chung-Ho Chen (Supervisor)

引用此

移植Tensorflow至CASLAB-GPUSIM模擬平台與矩陣函式庫優化
郁翔, 蘇. (Author). 2018 十一月 21

學生論文: Master's Thesis