基于强化学习的社区微电网能源管理:一项比较研究 | MDPI Sustainability
MDPI环境与地球科学
2026-06-02 18:30
文章摘要
本研究背景在于能源社区是实现清洁能源的关键一步,但需求与价格波动、可再生能源发电可变性及停电等因素使其管理复杂。研究目的是探索基于近端策略优化(PPO)算法的强化学习智能体在三种不同能源社区配置中进行能源管理的有效性,并对比其与传统规则控制器(RBC)的性能。研究使用开源的CityLearn仿真环境,设置了四种情景(仅电网、电网加太阳能无控制、RBC控制、PPO控制),根据年度成本、能耗、碳排放和峰值电力需求等指标进行比较。结论表明,仅向社区添加太阳能就能显著减少经济和环境影响。PPO智能体在产消者社区或混合型社区中优于RBC,能将成本与碳排放降低更多,但RBC在能源动态可预测的场所(如商业场所)中更高效,且在峰值能耗控制方面有优势。具体而言,在第一种和第三种配置中,PPO性能优于RBC;在第二种配置中,两者均不如电网加太阳能基线。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。