摘要:虛擬電廠儲能系統(tǒng)的智能調(diào)度尤為關鍵,因此提出了一種基于深度Q網(wǎng)絡(deepQnetwork,DQN)的虛擬電廠儲能數(shù)據(jù)挖掘方法,結合光伏發(fā)電功率、負荷功率和電力市場的實時動態(tài)電價,進行虛擬電廠儲能數(shù)據(jù)挖掘仿真研究。仿真實驗證實,在光伏發(fā)電功率大于負荷功率時,虛擬電廠儲能系統(tǒng)可以根據(jù)電價情況進行充放電操作,能調(diào)度收益,從而實現(xiàn)了對虛擬電廠儲能系統(tǒng)的智能化管理。該方法有效提升了虛擬電廠儲能系統(tǒng)的智能化水平和能源調(diào)度效率,為未來虛擬電廠智能化運行提供了新的方法。
關鍵詞:深度學習;神經(jīng)網(wǎng)絡;數(shù)據(jù)挖掘;虛擬電廠;儲能
0引言
隨著可再生能源的迅速增長和能源轉型的推進,虛擬電廠(virtualpowerplant,VPP)已成為實現(xiàn)能源智能化管理和提高系統(tǒng)靈活性的關鍵解決方案。在虛擬電廠中,儲能系統(tǒng)被視為重要的能量存儲設施,其運行的優(yōu)化對于平衡電力系統(tǒng)的供需、提高系統(tǒng)的可靠性至關重要。然而,隨著儲能系統(tǒng)規(guī)模的不斷擴大和運行復雜性的增加,如何有效利用儲能數(shù)據(jù)進行深度分析和挖掘,成為優(yōu)化虛擬電廠運行的關鍵挑戰(zhàn)之一。
人工智能是一種模擬人類智能行為的技術,其核心在于利用計算機系統(tǒng)模擬人類的思維過程以及學習能力,從而執(zhí)行各種任務。在人工智能領域,深度Q網(wǎng)絡(deepQnetwork,DQN)是一種基于深度學習和強化學習的方法,已在解決復雜的決策問題時展現(xiàn)出驚人的性能。DQN結合了深度神經(jīng)網(wǎng)絡的表征學習能力和Q學習(Q-learning)的強化學習框架,能夠自動從環(huán)境中學習并優(yōu)化決策策略,適用于探索和解決具有高度不確定性和復雜性的問題。DQN在視頻游戲、機器人控制、交通規(guī)劃等領域的成功應用,表明了其在決策制定和優(yōu)化方面的巨大潛力。在虛擬電廠儲能數(shù)據(jù)挖掘中,利用DQN可以有效地對儲能數(shù)據(jù)進行分析和建模,實現(xiàn)智能化的儲能系統(tǒng)管理,優(yōu)化系統(tǒng)的運作效能與經(jīng)濟效益。本文旨在探討基于DQN的虛擬電廠儲能數(shù)據(jù)挖掘方法,以加速能源智能化管理的實現(xiàn),并為能源系統(tǒng)的持久發(fā)展提供理論與技術支持。
1相關技術
1.1虛擬電廠儲能
虛擬電廠是一個創(chuàng)新性的能源管理系統(tǒng),其通過整合多樣的分布式能源資源和電力設備,實現(xiàn)對電力系統(tǒng)的智能化協(xié)調(diào)。在虛擬電廠中,通過統(tǒng)一調(diào)度太陽能光伏電池、風力渦輪機、小型燃氣發(fā)電機組等分散的能源資源,實現(xiàn)了多能源的整合。智能化控制系統(tǒng)能夠實時監(jiān)測電力需求、能源生產(chǎn)狀況以及市場價格,從而實現(xiàn)對能源資源的智能調(diào)度、提高系統(tǒng)的工作效率和降低成本。虛擬電廠的靈活能源調(diào)度能夠使其適應不同地區(qū)和能源的可用性,而且通過參與電力市場,其還能提供調(diào)頻、備用能量等服務。更為重要的是,虛擬電廠通過整合儲能技術,解決了可再生能源波動性的問題,實現(xiàn)在高產(chǎn)能時儲存過剩能量,在需求高峰期釋放儲存的能量,從而提高可再生能源的可靠性。
儲能技術用于將電能轉化為其他形式的能量,并在需要時將其重新轉換為電能,旨在增強電力系統(tǒng)的穩(wěn)定性與適應性。常見的儲能方法包括利用電池進行能量存儲、壓縮空氣儲能、水泵儲能、電容器和熱能儲能。電池儲能系統(tǒng)被廣泛用于移動設備和電動汽車,而壓縮空氣、水泵和熱能儲能技術則在大規(guī)模電力系統(tǒng)中應用廣泛,這些技術的使用有助于平衡供需,提高電力系統(tǒng)的可靠性。
1.2數(shù)據(jù)挖掘
數(shù)據(jù)挖掘技術是利用統(tǒng)計學、機器學習和數(shù)據(jù)庫技術等方法,從大規(guī)模數(shù)據(jù)中發(fā)現(xiàn)模式、關聯(lián)和趨勢的計算過程。數(shù)據(jù)挖掘技術包括多種方法,如聚類分析、分類技術、關聯(lián)規(guī)則發(fā)現(xiàn)、異常識別等,通過數(shù)據(jù)挖掘,可以幫助組織和企業(yè)從大量數(shù)據(jù)中挖掘出有用的信息,進行預測性分析、決策支持以及優(yōu)化業(yè)務流程,從而實現(xiàn)運營和更好的業(yè)務決策。
數(shù)據(jù)挖掘流程通常涵蓋數(shù)據(jù)預處理、選擇特征、模型構建和評估等環(huán)節(jié),通過這些環(huán)節(jié)可以從初始數(shù)據(jù)中提取有價值的信息,并將其轉化為可理解的知識,為決策提供支持。隨著數(shù)據(jù)量的不斷增長和算法的不斷發(fā)展,數(shù)據(jù)挖掘技術在各個領域的應用前景也變得越來越廣闊。
虛擬電廠儲能數(shù)據(jù)挖掘是利用數(shù)據(jù)挖掘技術對虛擬電廠中儲能系統(tǒng)的運行數(shù)據(jù)進行分析與深入挖掘,以發(fā)現(xiàn)儲能系統(tǒng)的運行模式、優(yōu)化策略和潛在問題。通過對儲能數(shù)據(jù)進行預處理、模式識別和建模分析,可以實現(xiàn)對儲能系統(tǒng)充放電行為、效率、壽命等方面的深入理解,并提供決策支持和優(yōu)化建議,進而增進虛擬電廠的操作效率、經(jīng)濟效益及可靠性。
2基于DQN的虛擬電廠儲能技術
2.1DQN
DQN融合了深度學習和強化學習,旨在處理具有離散行為空間的決策問題[4-5]。其核心思想是采用深度神經(jīng)網(wǎng)絡對Q函數(shù)進行近似估計,即狀態(tài)—動作值函數(shù),從而使智能體在其所處環(huán)境中做出選擇。在DQN中,智能體的目標是學習一個策略,使得在給定狀態(tài)下選擇能累積獎勵的動作。
DQN的核心是Q-learning的更新規(guī)則,其中Q值的更新通過貝爾曼方程實現(xiàn)。其Q值的更新公式如下:
其中,α為學習率,a為動作,s為狀態(tài),Q(s,a)為在狀態(tài)s下采取動作a的Q值,r為在狀態(tài)s下采取動作a后獲得的即時獎勵,γ為折扣因子,s'為采取動作a后轉移到的下一個狀態(tài),maxa'Q(s',a')則表示在狀態(tài)s'下選擇動作所對應的Q值。
DQN通過使用深度神經(jīng)網(wǎng)絡來逼近Q函數(shù),將狀態(tài)s作為輸入,輸出各個動作的Q值。通過不斷與環(huán)境交互、收集數(shù)據(jù)和更新網(wǎng)絡參數(shù),DQN能夠學習到逼近Q函數(shù)的策略,從而實現(xiàn)智能體在復雜環(huán)境中的決策。
2.2基于DQN的儲能交互模型
智能能源管理系統(tǒng)由4個核心部分構成,包括仿真模塊、經(jīng)驗池模塊、神經(jīng)網(wǎng)絡模塊以及動作搜索模塊,這些模塊共同在虛擬電廠儲能交互模型中發(fā)揮作用。虛擬電廠的仿真模塊模擬了光伏、儲能、負載以及主電網(wǎng),展示了在動態(tài)電價條件下光儲型虛擬電廠進行能量交易的過程。為了大限度地利用光伏發(fā)電,負荷電能首先由光伏發(fā)電和儲能系統(tǒng)聯(lián)合滿足,剩余需求則由主電網(wǎng)供應。經(jīng)驗池模塊負責在系統(tǒng)運作過程中收集虛擬電廠仿真模塊生成的交互數(shù)據(jù),為模型的后續(xù)訓練提供堅實基礎。神經(jīng)網(wǎng)絡模塊的職責是訓練神經(jīng)網(wǎng)絡的參數(shù),目的是提升系統(tǒng)的決策效能。動作搜索模塊在模型運行過程中實現(xiàn)了狀態(tài)—動作的選擇,采用貪心策略等方法,使系統(tǒng)能夠在不斷學習的過程中做出更為智能和優(yōu)化的決策。基于DQN的儲能交互模型如圖1所示,該模型的結構旨在使虛擬電廠更好地適應動態(tài)電價、靈活應對光伏發(fā)電波動性,實現(xiàn)能源的調(diào)度和利用。其中,時間差分誤差是強化學習中用于衡量預測的誤差的一種指標。在強化學習框架中,智能體通過與環(huán)境互動來學習決策策略,時間差分誤差通常用于評估當前策略的預測值與實際值之間的差異。
圖1基于DQN的儲能交互模型
3實驗過程與結果
3.1DQN參數(shù)設置
本文使用DQN進行儲能交互,DQN參數(shù)細節(jié)如表1所示。
3.2實驗結果
本文中使用Python進行儲能策略的挖掘與仿真分析,利用的數(shù)據(jù)涵蓋了光伏發(fā)電的功率、負載需求的功率,以及電力市場上的實時變化電價。將訓練好的DQN用于測試。根據(jù)DQN測試結果可知,在時間段內(nèi),儲能系統(tǒng)根據(jù)電價情況進行充放電操作,以調(diào)度收益。具體而言,當電價超過平均水平時,儲能進行充電以獲取正獎勵;相反,當電價低于平均水平時,系統(tǒng)會向用戶的電負荷釋放電能。而在光伏發(fā)電功率超過負載需求的情況下,根據(jù)棄光懲罰約束,儲能在一些時間段選擇充電,而在另一些時間段則不進行充電,以避免發(fā)生過充現(xiàn)象。綜上,DQN算法能夠有效地挖掘出儲能系統(tǒng)的操作策略,使其能夠適應不同電價情況下的充放電需求。
4安科瑞Acrel-2000MG微電網(wǎng)能量管理系統(tǒng)
4.1概述
Acrel-2000MG儲能能量管理系統(tǒng)是安科瑞專門針對工商業(yè)儲能電站研制的本地化能量管理系統(tǒng),可實現(xiàn)了儲能電站的數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)查詢與分析、可視化監(jiān)控、報警管理、統(tǒng)計報表、策略管理、歷史曲線等功能。其中策略管理,支持多種控制策略選擇,包含計劃曲線、削峰填谷、需量控制、防逆流等。該系統(tǒng)不僅可以實現(xiàn)下級各儲能單元的統(tǒng)一監(jiān)控和管理,還可以實現(xiàn)與上級調(diào)度系統(tǒng)和云平臺的數(shù)據(jù)通訊與交互,既能接受上級調(diào)度指令,又可以滿足遠程監(jiān)控與運維,確保儲能系統(tǒng)安全、穩(wěn)定、可靠、經(jīng)濟運行。
4.2應用場景
適用于工商業(yè)儲能電站、新能源配儲電站。
4.3系統(tǒng)結構
4.4系統(tǒng)功能
(1)實時監(jiān)管
對微電網(wǎng)的運行進行實時監(jiān)管,包含市電、光伏、風電、儲能、充電樁及用電負荷,同時也包括收益數(shù)據(jù)、天氣狀況、節(jié)能減排等信息。
(2)智能監(jiān)控
對系統(tǒng)環(huán)境、光伏組件、光伏逆變器、風電控制逆變一體機、儲能電池、儲能變流器、用電設備等進行實時監(jiān)測,掌握微電網(wǎng)系統(tǒng)的運行狀況。
(3)功率預測
對分布式發(fā)電系統(tǒng)進行短期、超短期發(fā)電功率預測,并展示合格率及誤差分析。
(4)電能質(zhì)量
實現(xiàn)整個微電網(wǎng)系統(tǒng)范圍內(nèi)的電能質(zhì)量和電能可靠性狀況進行持續(xù)性的監(jiān)測。如電壓諧波、電壓閃變、電壓不平衡等穩(wěn)態(tài)數(shù)據(jù)和電壓暫升/暫降、電壓中斷暫態(tài)數(shù)據(jù)進行監(jiān)測分析及錄波展示,并對電壓、電流瞬變進行監(jiān)測。
(5)可視化運行
實現(xiàn)微電網(wǎng)無人值守,實現(xiàn)數(shù)字化、智能化、便捷化管理;對重要負荷與設備進行不間斷監(jiān)控。
(6)優(yōu)化控制
通過分析歷史用電數(shù)據(jù)、天氣條件對負荷進行功率預測,并結合分布式電源出力與儲能狀態(tài),實現(xiàn)經(jīng)濟優(yōu)化調(diào)度,以降低尖峰或者高峰時刻的用電量,降低企業(yè)綜合用電成本。
(7)收益分析
用戶可以查看光伏、儲能、充電樁三部分的每天電量和收益數(shù)據(jù),同時可以切換年報查看每個月的電量和收益。
(8)能源分析
通過分析光伏、風電、儲能設備的發(fā)電效率、轉化效率,用于評估設備性能與狀態(tài)。
(9)策略配置
微電網(wǎng)配置主要對微電網(wǎng)系統(tǒng)組成、基礎參數(shù)、運行策略及統(tǒng)計值進行設置。其中策略包含計劃曲線、削峰填谷、需量控制、新能源消納、逆功率控制等。
5硬件及其配套產(chǎn)品
序號 | 設備 | 型號 | 圖片 | 說明 |
1 | 能量管理系統(tǒng) | Acrel-2000MG | 內(nèi)部設備的數(shù)據(jù)采集與監(jiān)控,由通信管理機、工業(yè)平板電腦、串口服務器、遙信模塊及相關通信輔件組成。 數(shù)據(jù)采集、上傳及轉發(fā)至服務器及協(xié)同控制裝置 策略控制:計劃曲線、需量控制、削峰填谷、備用電源等 | |
2 | 顯示器 | 25.1英寸液晶顯示器 | 系統(tǒng)軟件顯示載體 | |
3 | UPS電源 | UPS2000-A-2-KTTS | 為監(jiān)控主機提供后備電源 | |
4 | 打印機 | HP108AA4 | 用以打印操作記錄,參數(shù)修改記錄、參數(shù)越限、復限,系統(tǒng)事故,設備故障,保護運行等記錄,以召喚打印為主要方式 | |
5 | 音箱 | R19U | 播放報警事件信息 | |
6 | 工業(yè)網(wǎng)絡交換機 | D-LINKDES-1016A16 | 提供 16 口百兆工業(yè)網(wǎng)絡交換機解決了通信實時性、網(wǎng)絡安全性、本質(zhì)安全與安全防爆技術等技術問題 | |
7 | GPS時鐘 | ATS1200GB | 利用 gps 同步衛(wèi)星信號,接收 1pps 和串口時間信息,將本地的時鐘和 gps 衛(wèi)星上面的時間進行同步 | |
8 | 交流計量電表 | AMC96L-E4/KC | 電力參數(shù)測量(如單相或者三相的電流、電壓、有功功率、無功功率、視在功率,頻率、功率因數(shù)等)、復費率電能計量、 四象限電能計量、諧波分析以及電能監(jiān)測和考核管理。多種外圍接口功能:帶有RS485/MODBUS-RTU 協(xié)議:帶開關量輸入和繼電器輸出可實現(xiàn)斷路器開關的"遜信“和“遙控"的功能 | |
9 | 直流計量電表 | PZ96L-DE | 可測量直流系統(tǒng)中的電壓、電流、功率、正向與反向電能??蓭?RS485 通訊接口、模擬量數(shù)據(jù)轉換、開關量輸入/輸出等功能 | |
10 | 電能質(zhì)量監(jiān)測 | APView500 | 實時監(jiān)測電壓偏差、頻率俯差、三相電壓不平衡、電壓波動和閃變、諾波等電能質(zhì)量,記錄各類電能質(zhì)量事件,定位擾動源。 | |
11 | 防孤島裝置 | AM5SE-IS | 防孤島保護裝置,當外部電網(wǎng)停電后斷開和電網(wǎng)連接 | |
12 | 箱變測控裝置 | AM6-PWC | 置針對光伏、風能、儲能升壓變不同要求研發(fā)的集保護,測控,通訊一體化裝置,具備保護、通信管理機功能、環(huán)網(wǎng)交換機功能的測控裝置 | |
13 | 通信管理機 | ANet-2E851 | 能夠根據(jù)不同的采集規(guī)的進行水表、氣表、電表、微機保護等設備終端的數(shù)據(jù)果集匯總: 提供規(guī)約轉換、透明轉發(fā)、數(shù)據(jù)加密壓縮、數(shù)據(jù)轉換、邊緣計算等多項功能:實時多任務并行處理數(shù)據(jù)采集和數(shù)據(jù)轉發(fā),可多鏈路上送平臺據(jù): | |
14 | 串口服務器 | Aport | 功能:轉換“輔助系統(tǒng)"的狀態(tài)數(shù)據(jù),反饋到能量管理系統(tǒng)中。 1)空調(diào)的開關,調(diào)溫,及斷電(二次開關實現(xiàn)) 2)上傳配電柜各個空開信號 3)上傳 UPS 內(nèi)部電量信息等 4)接入電表、BSMU 等設備 | |
15 | 遙信模塊 | ARTU-K16 | 1)反饋各個設備狀態(tài),將相關數(shù)據(jù)到串口服務器: 讀消防 VO信號,并轉發(fā)給到上層(關機、事件上報等) 2)采集水浸傳感器信息,并轉發(fā)3)給到上層(水浸信號事件上報) 4)讀取門禁程傳感器信息,并轉發(fā) |
6結論
在當前能源轉型的背景下,儲能技術作為一種重要的能源存儲手段,受到了廣泛關注。本文采用DQN算法,結合光伏發(fā)電功率、負荷功率和電力市場的實時動態(tài)電價等因素,進行了虛擬電廠儲能策略挖掘仿真研究。結果顯示,在光伏發(fā)電功率大于負荷功率時,儲能根據(jù)電價情況進行充放電操作,以調(diào)度收益,從而實現(xiàn)了對虛擬電廠儲能系統(tǒng)的智能化管理。未來的研究可以進一步探討不同約束條件下的儲能調(diào)度策略,并考慮更多的環(huán)境因素和實際應用場景。
【參考文獻】
[1]田壁源,常喜強,戚紅燕,等.基于混合博弈的園區(qū)虛擬電廠廣義儲能共享與協(xié)同優(yōu)化調(diào)度[J].電力需求側管理,2023,25(4):8-14
[2]李鵬程.基于混合博弈和虛擬電廠的電力市場運行優(yōu)化研究[D].蘭州:蘭州理工大學,2023.
[3]安科瑞企業(yè)微電網(wǎng)設計與應用手冊.2022年05版
[4]高琳,劉甲林,李靜.基于深度Q網(wǎng)絡的虛擬電廠儲能數(shù)據(jù)挖掘