摘要:为解决当前室内环境受多种时变参数影响,不确定影响较大且现有控制设备无法根据室内环境对工作功率进行自适应调节造成了极大能源浪费的问题,采用在深度确定性策略梯度(Deep deterministic policy gradient,DDPG)中融入优先经验重放(Prioritized experience replay,PER)的方法,合理优化控制设备功率对室内空气质量(Indoor air quality,IAQ)和热舒适度进行控制。实验证明,所提出的DDPG-PER算法能够在冬夏两季不同室外空气质量条件下,结合多时变参数将室内环境控制在要求范围之内。而且,相比定风量控制系统降低了能源成本13.30%,全年可节约2000元左右电费,对我国“碳中和”策略和绿色低碳建筑的发展具有一定价值。