1、Electrical Automation电气自动化 2023 年第 45 卷 第 1 期电力系统及其自动化Power System Automation基于深度回归森林的短期电力负荷预测黄文思,陆鑫,陈婧,林超,薛迎卫,施炜炜(国网信通亿力科技有限责任公司,福建 福州350003)摘要:为减轻深度学习算法对于网络超参数的依赖,提出了基于深度回归森林的短期电力负荷预测方法。所提方法利用深度森林的默认超参数构建多粒度扫描过程和级联森林过程的森林模型。首先,通过多粒度扫描过程有效学习样本的内在特征并提取序列数据的时序特征;然后,将所有特征向量用作级联森林过程的输入,筛选最终特征向量;最后,利用训练
2、数据的特征对预测样本进行预测。结果表明,所提方法能够有效地减轻超参数配置对深度学习模型的影响,预测结果比较精确。关键词:深度回归森林;短期负荷预测;多粒度扫描过程;级联森林过程;数据挖掘DOI:10 3969/j issn 1000 3886 2023 01 005 中图分类号 TP181 文献标志码 A 文章编号 1000 3886(2023)01 0018 04Short term Electrical Load Forecasting Based on Deep egression ForestHuang Wensi,Lu Xin,Chen Jing,Lin Chao,Xue Yingw
3、ei,Shi Weiwei(State Grid Info Telecom Great Power Science and Technology Co,Ltd,Fujian Fuzhou 350003,China)Abstract:In order to reduce the dependence of deep learning algorithm on network hyperparameters,a short-term power load forecasting methodbased on deep regression forest was proposed The propo
4、sed method used the default super parameters of deep forest to construct theforest model of multi granularity scanning process and cascade forest process Firstly,the internal features of samples were effectivelylearned through the multi granularity scanning process,and the temporal features of seque
5、nce data were extracted Then,all featurevectors were used as the input of cascade forest process to filter the final feature vector Finally,the characteristics of training datawere used to predict the prediction samples The results show that the proposed method can effectively reduce the influence o
6、fhyperparameter configuration on the deep learning model,and the prediction results are more accurateKeywords:deep regression forest;short-term load forecasting;multi-grained scanning procedure;cascade forest procedure;data mining定稿日期:2022 10 200引言负荷预测对于指导电力系统经济调度运行计划的制定具有重要意义1。电力系统的负荷预测可分为长期负荷预测、中期
7、负荷预测、短期负荷预测和超短期负荷预测2。其中,短期负荷预测将给出次日每 15 min 的负荷预测值,具有明显的周期性,容易受到各种突发情况和环境因素的影响,如季节性气候变化3。传统的时间序列预测方法难以考虑众多外部因素的影响,其预测结果仅依赖于较少的负荷曲线数据,精度十分有限。因此,机器学习算法被引入到短期负荷预测中。文献 4考虑量测时间尺度上的差异性,应用长短期记忆网络模型,实现了在不同颗粒度数据的整合,并通过实际负荷数据进行验证分析。文献 5针对智能楼宇的能效管理控制对于负荷预测数据的要求,通过聚类分析构建典型的训练样本集并采用支持向量机构建短期负荷预测模型。文献 6 将负荷时序曲线进行
8、集总经验模态分解,对各个分量改进人工神经网络进行预测模型的构建,并获得最终预测值。文献 7 将径向基神经网络应用于短期负荷预测,并采用岭回归来获得输出层权值参数的估计值。深度神经网络通过预训练过程来减少局部最优解的出现,在应用于负荷预测问题时具有更好的性能,但训练效果取决于手动配置和超参数的调节。为了在短期负荷预测的超参数配置较少的情况下获得更准确的预测性能,本文引入深度回归森林,其基于多粒度级联森林过程来实现对数据特征信息的挖掘,通过算例分析验证所提方法的优越性。1深度回归森林深度回归森林基于随机森林和深度神经网络的思想,将预测过程分为多粒度扫描过程和级联森林过程,前者提取样本特征并挖掘时序
9、数据的序列特征,后者进一步提高预测准确性。1 1随机森林随机森林的决策树分类器集合可表示为 f(X,k),k=1,N,其中:k为随机向量,表征决策树增长过程,其与第 k 个决策树具有相同的分布特性。图1 给出了随机森林的分类过程。通过随机森林获得的决策可以描述为:F(x)=arg maxNi=1I fi(x)=Y(1)式中:F(x)为由随机森林获得的决策;fi为随机森林模型的第 i个决策树;Y为目标变量;I()为度量函数。随机森林模型通过构造不同的训练集来训练每个决策树。随着这些基本分类器之间差异程度的增加,随机森林将获得更高的性能。将分类回归树应用于深度森林算法中,可以处理大规模样本集并解决
10、非线性分类问题。本文采用基尼系数作为分类回归树属性的度量。基尼系数越小,分类性能越好。基尼系数 Ggini由式(2)计算。81Electrical Automation电力系统及其自动化Power System Automation电气自动化 2023 年第 45 卷 第 1 期图 1随机森林的分类过程Ggini=1 ci=1p(i|t)2(2)式中:p(i|t)为测试样本 t 属于第 i 类的概率值;c 为所有类的数量。1 2多粒度扫描过程多粒度扫描过程可以有效地学习样本的内在特征并提取序列数据的时序特征,图 2 为多粒度扫描过程。由于多粒度扫描过程增加了特征的最终维数,因此深度森林可以处理
11、这些特征的序列关系。1 3级联森林过程级联森林过程反映了深度森林的深度学习过程,其每个级别都包含几种不同类型的森林模型。在级联森林过程中,每个级别图 2多粒度扫描过程先从上级获取处理后的特征信息,再将所生成的特征信息应用于下一级别的新特征信息。图 3 为深度森林的级联森林过程。图 3级联森林过程为减轻深度回归森林级联森林过程的过度拟合,将 k 折交叉验证方法应用于级联森林过程的每个森林生成的类向量(本文 k取 3)。样本经过(k 1)次训练获得(k 1)个类别向量;将类别向量的平均值设为下一级的增强特征。为了确保预测模型的泛化程度并提高其适用性,本文使用随机森林模型和完全随机树森林模型来处理数
12、据。1 4深度回归森林步骤深度回归森林的主要步骤如下:(1)数据预处理。排除无效数据,用线性插值填充丢失的数据,对训练样本集进行划分。(2)用训练样本集训练深度回归森林。利用深度森林的默认超参数构建多粒度扫描过程和级联森林过程的森林模型。(3)利用训练数据的特征对预测样本进行预测。预测样本的特征数据将依次经过多粒度扫描过程和级联森林过程的处理。深度回归森林的参数是自动调节的,可以降低深度学习算法对于超参数取值的依赖问题。2算例仿真与分析样本数据采用某城市从 2012 年 1 月 1 日至 2015 年 1 月 10日的历史负荷数据(每 15 min 采样一次)和气象数据(最低、平均和最高温度,
13、相对湿度和降雨信息),对 2015 年 1 月 10 日至 1 月16 日之间的系统负荷进行预测,并将预测结果与随机森林回归8、深度神经网络(Nh=20 20 20 20)、人工神经网络(Nh=80)、最小二乘算法和 Fletcher-Powell 共轭梯度算法进行比较。随机回归森林的超参数采用表 1 中的默认数值。表 1深度森林回归的默认超参数过程超参数默认值多粒度扫描过程级联森林过程滑窗大小 d/16,d/8,d/4决策树数量500决策树深度100森林数量2决策树数量500决策树深度100森林数量8利用不同的训练样本集对本文所提深度回归森林进行训练后,将测试集数据作为输入特征量进行预测。表
14、 2 为各算法七组测试数据下的平均预测相对误差,图 4 6 分别为不同 N 值下的预测结果。91Electrical Automation电气自动化 2023 年第 45 卷 第 1 期电力系统及其自动化Power System Automation表 2各算法预测结果误差对比单位:%算法N=7N=21N=40深度回归森林1483 70 744 50745 7随机森林回归1545 41 108 50947 2深度神经网络5686 21 700 81218 6人工神经网络4647 32 083 61761 8最小二乘法3178 92 129 42500 5Fletcher-Powell 共轭梯度
15、5151 64 318 94346 5图 4N=7 时的短期负荷曲线预测结果图 5N=21 时的短期负荷曲线预测结果图 6N=40 时的短期负荷曲线预测结果由表 2 可知,本文方法所得预测误差在三种情况下的误差均为最小,具有较优预测精度。图4、图5 更为直观地表明深度回归森林对负荷的近似效果最好。因此,应用深度回归森林可以获得最佳效果的短期负荷预测值。同时表 2 也表明采用前 40 d 与前21 d 的历史数据所得预测结果要远优于采用前 7 d 的历史数据。而当 N=40 时与 N=21 时所得预测结果的精度是基本一致,N=21 能够在最大程度上平衡训练复杂度和预测精度。图 7 为不同超参数下
16、的预测误差,可以发现在不同参数下的预测精度基本是一致的,这说明深度回归森林并不过分依赖于超参数的取值,具有较高的适应能力和泛化能力。图 7深度回归森林不同超参数下的预测误差3结束语本文提出了基于深度回归森林的电力系统短期负荷预测方法。分别利用 7 d、21 d 和 40 d 时间尺度下的历史数据对深度回归森林进行训练。研究发现,与其他常见机器学习算法相比,本文中的深度回归森林在应用于短期电力负荷预测时表现出最优的预测精度;深度回归森林是一种基于决策树的集成算法,能够有效地降低机器学习算法对于超参数取值的依赖。今后将进一步研究探讨基于改进深度回归森林的超短期、中期和长期电力负荷预测方法。参考文献:1 刘新苗,李卓环,曾凯文,等 基于集群负荷预测的主动配电网多目标优化调度 J 电测与仪表,2021,58(5):98 1042 SEEKUMA S,V EMA J,SUJIL A,et al,Comparative analysisof intelligently tuned support vector regression models for short term loadforecas