以FPGA實現基於HOG多尺度之影像中行人偵測

Translated title of the thesis: FPGA Implementation of HOG based Multi-scale Pedestrian Detection
  • 張 哲榮

Student thesis: Master's Thesis

Abstract

物件偵測在?多領域所需包含監視系統、先進駕駛輔助系統(Advanced Driver Assistance Systems ADAS)、智慧型運輸系統(Intelligent Transport System ITS)、機器人、四軸飛行器與便攜式電子產品等。在這些應用領域中,行人偵測是一個重要的議題,因為在人為疏失下可能直接或間接的傷害人。因人與相機間的距離不一和人本身高度不一,使得在影像內呈現大小不一的行人,要偵測出影像中所有行人不同大小的行人,需要一個支援多尺度偵測的行人偵測系統。 在此篇論文中,我們提出一個以硬體方式來執行多尺度行人偵測的方法。這一個方法包含三個步驟:首先,我們需要加彩色圖片轉換至灰階圖,再將其減取樣得到三個不同大小的灰階圖。第二步,從三個不同大小的灰階圖中萃取出不同是窗大小的HOG(Histograms of oriented gradients)特徵。最後,使用線性的支援向量機(Support vector machine SVM)去辨識不同偵測視窗大小的特徵。但由於此方法運算量大沒辦法再軟體端執行達到即時的偵測,所以將其方法使用FPGA(Field Programmable Gate Array)電路設計實現,以硬體電路設計架構實現即時的多尺度行人偵測。 最後,從實驗結果所顯示此系統使用了94 374邏輯元素(Logic elements LEs),共使用了Terasic DE2-115開發板約莫82%的資源,此系統的準確率平均約在97%,且處理能力可達每秒60張640x480解析度的影像。
Date of Award2017 Aug 31
Original languageChinese
SupervisorMing-Shi Wang (Supervisor)

Cite this

'