含虚拟惯量的虚拟电厂Nash-Q强化学习调度策略

打开文本图片集
摘 要:目前,对于高效利用广泛接入电网的分布式电源问题的研究存在不足。该文通过结合博弈论与强化学习,提出一种含虚拟惯量的虚拟电厂Nash-Q强化学习调度策略,解决具有高随机性和不确定性的分布式电源协调优化调度的问题。首先,建立一个综合考虑碳排放、经济性、出力和惯量约束的虚拟电厂混合目标调度模型,并进一步构造出纳什均衡模型;然后,针对燃气轮机组出力、风光机组出力、储能电池组出力和碳交易量定义多智能体,并构造多智能体的状态空间、动作空间集合和奖励函数,通过马尔可夫决策不断学习更新价值函数;最后,在线推演输出多时间尺度最优调度策略。(剩余17251字)