Online Interactive Bidding Strategy for Demand Response Based on DDPG Machine Learning Method

論文翻譯標題: 使用DDPG機器學習方法之線上交互式聚合商需量反應競價決策系統
  • 李 冠承

學生論文: Doctoral Thesis

摘要

需量反應作為未來電網中之能源選項,具有效抑低尖峰負載、反應時間短、可提高再生能源使用效率及低成本之優點。其可細分為不同類型如自動控制型需量反應、誘因型需量反應、緊急型需量反應及需量競價。然而對於需量反應用戶群代表參與需量競價之相關研究尚在起步階段。 對於整合不同用戶的用戶群代表而言,需在考慮用戶群卸載潛力的同時做出對系統運營商的競標價和投標量之決策。因此本研究之重點為如何整合不同用戶參與之意願及可能的卸載量並且藉由機器學習之方法決定投標策略,以確保用戶群之穩定卸載量及最佳化用戶群代表之獲利。本研究提出以深度確定性策略梯度演算法(DDPG),透過學習過去的包含系統備轉容量率及用戶群之投標更新模型參數之投標經驗以最佳化投標價及投標量之決策。同時本研究使用每日最新獲得的投標經驗進行線上學習,確保模型有追隨市場變化之適應力。 本研究使用兩個模擬器驗證模型之強健性。模擬結果顯示本研究提出之模型可於各種情境中,藉由線下/線上學習提出精確之投標建議,以最佳化用戶群代表之獲利。
獎項日期2020
原文English
監督員Hong-Tzer Yang (Supervisor)

引用此

'