1、电子设计工程Electronic Design Engineering第31卷Vol.31第6期No.62023年3月Mar.2023收稿日期:2021-09-09稿件编号:202109050基金项目:国网宁夏电力公司管理咨询项目(8129NX2000B5)作者简介:王 运(1986),男,陕西定边人,硕士,高级工程师。研究方向:电力系统及其自动化。化石能源的过度消耗所带来的能源枯竭、环境污染问题,催生出了新能源技术。其技术种类多样、发展迅速,并具有较高的渗透率,这对电网的短期负荷预测提出了较大挑战。目前,常用的负荷预测技术包括时间序列预测、神经网络和卡尔曼滤波估计器,具体实现方法包括基于长短
2、期记忆(LSTM)的电器行为学习、人工神经网络、基于遗传的多层感知以及模糊专家系统等。面向高渗透率新能源电网的短期负荷预测算法设计王 运1,孙小湘1,祁 鑫1,张天睿2,陈 婧2(1.宁夏电力调度控制中心,宁夏 银川 750001;2.北京清能互联科技有限公司,北京 100084)摘要:对高渗透率的新能源电网进行负荷预测具有重要的研究价值,文中针对新能源智能电网高动态和高不确定性的特点,提出了一种新的负荷预测算法,该算法可有效解决新能源负荷数据分类问题与短期负荷预测问题。为解决新能源数据分类问题,采用聚类技术创建具有共同特征的数据区域,进而得出数据聚类的最优解。同时通过选取卡尔曼滤波器与小波神
3、经网络筛选混合预测算法,选出效果最优的混合预测模型,有效提高了预测模型的准确性。以某电网的真实数据集作为原始数据,由仿真实验结果可知,文中所提模型平均绝对百分比误差低于 1%,相比于单一预测模型具有更优的预测效果。关键词:新能源;高渗透率;短期负荷预测;聚类算法中图分类号:TN99;TP393文献标识码:A文章编号:1674-6236(2023)06-0153-05DOI:10.14022/j.issn1674-6236.2023.06.032Design of shortterm load forecasting algorithm for high penetration ratenew
4、energy gridWANG Yun1,SUN Xiaoxiang1,QI Xin1,ZHANG Tianrui2,CHEN Jing2(1.Ningxia Power Dispatching Control Center,Yinchuan 750001,China;2.Beijing Tsintergy Technology Co.,Ltd.,Beijing 100084,China)Abstract:Load forecasting for high permeability new energy grid has important research value.According t
5、o the characteristics of high dynamics and high uncertainty of new energy smart grid,a newload forecasting algorithm is proposed.The algorithm can effectively solve the problem of new energy loaddata classification and short term load forecasting.In order to solve the problem of new energy dataclass
6、ification,the data area with common characteristics is created by clustering technology,and theoptimal solution of data clustering is obtained.By selecting Kalman filter and wavelet neural network,thehybrid prediction algorithm is selected.Based on the hybrid prediction model with the best effect,th
7、eaccuracy of the prediction model is effectively improved.Taking the real data set of a power grid as theoriginal data,the simulation results show that the average absolute percentage error of the proposedmodel is less than 1%,which has better prediction effect than a single prediction model.Keyword
8、s:new energy;high penetration rate;shortterm load forecasting;clustering algorithm-153电子设计工程 2023年第6期该文使用聚类技术,基于卡尔曼滤波技术与小波神经网络设计了短期电网负荷预测算法。1基于数据聚类的分析模型选取电网短期负荷的消耗特征定义方式种类繁多,因此该文使用聚类技术1在数据分析软件 R-studio和Matlab的辅助下,采用统计分析方法定义短期消耗的特征2,建立具有共同特征的数据共同区域3。创建聚类区域后,将数据提供给后续估计算法进行预测,进而减少预测数据的误差4。降低误差的关键因素为数据群
9、的大小及数量。故尝试使用不同的集群数量与大小组合,并验证预测数据及实际数据的误差5,经统计分析后得出结论。电网负荷数据聚类的最佳选择,是将其聚类到 6 个不同的簇数6。通过多次实验可知,若簇数大于 8或小于 2,则后续识别算法无法正常工作,因此数据分类簇数的最佳选择为6。基于朴素的 K-means 技术对负载段进行聚类时,定义Z为具有t个实例的数据,可将Z分类为 K个不相交的聚类S1,S2,SK7。则误差E可由下式定义:E=i=1KxSiD(y,(Si)(1)其中,(Si)是簇Si的质心。D(y,(Si)是数据点y与(Si)之间的距离,即任何数据点的欧几里德距离。而对于数据yi=(yi1,yi
10、2,yin)与yj=(yj1,yj2,yjn)的欧式距离可通过下式定义:DE(yi,yj)=|k=1n(yik-yjk)21 2(2)该文使用多种预测模型,将聚类数据聚合到预测混合模型中,如图1所示。图1输入输出聚类预测聚合模型如图 1所示,将数据首先送入聚类算法,再把聚类后的数据送入不同的预测模型以选择最佳预测模型组合,然后将数据聚合为一个模型。2混合模型算法2.1卡尔曼滤波预测算法卡尔曼滤波预测器是使用线性动力系统进行状态估计的最常用方法之一,该模型定义如下:xk=Fxk-1+Buk-1+wk-1(3)式中,F是应用于前一个状态向量xk-1的状态转移矩阵,B是应用于控制向量uk-1的控制输
11、入矩阵,wk-1是过程噪声向量,为零均值高斯分布,卡尔曼滤波预测器用于估计xk。卡尔曼滤波预测器分为 两 级:预 测 和 更 新。预 测 基 于 状 态 估 计x?k=x?k-1+Buk-1,更新使用残差y?k=Zk-Hx?k。其中Z是测量向量,H是测量矩阵。2.2小波神经网络预测算法小波神经网络(WNN)具有与人工神经网络(ANN)相同的能力,其在隐藏层中具有不同的激活函数8。由于激活函数为局部小波函数,WNN 具有更紧凑的技术与学习速度,输出类似于 ANN方式的加权小波总和9。定义wjk为隐藏单元j和输入单元k之间的权重10,则加权输入总和定义为fj(n):fj(n)=k=0mwjk(n)
12、xk(n)(4)式中,xk(n)为第 k个输入。每个隐藏神经元的输出定义为:a,b(fj(n)=(fj(n)-bj(n)/aj(n)(5)其中,为小波函数,aj(n)定义为尺度,bj(n)为隐藏神经元中小波函数的平移系数。输出神经元的输入f(n)与输出y(n),wij是输出 i与隐藏单元 j之间的权重,由以下等式定义11:f(n)=k=0mwij(n)a,b(fj(n)(6)y(n)=f(n)(7)式中,表示输出与输入间的映射关系。2.3特征构建工程由于特征构建和选择在基于神经网络的预测模型中起着重要作用,因此该文深入分析了基于神经网络中的权重选择特征及其重要性12。表 1显示了数据集的 R2
13、得分,其用于表征数据拟合的优度,是-154预测任务的重要特征。表1数据集的单输出模型结果实验编号MT1-OP10MT1-OP20MT2-OP10MT2-OP20基线的R2得分0.1510.6330.0780.347训练集R2得分0.8610.7440.8000.830测试集R2得分0.6290.6750.0680.637为了解决特征重要性的表征问题,将不同输入特征的神经网络权重归一化后进行评估。这提供了特征重要性的定性描述,但没有准确的结果分析13。MT1-OP20实验中存在代表电力生产周期时间滞后特征的权重较高(R2得分为0.6以上),而MT1-OP10基线数据和 MT2-OP10测试集数据
14、中存在的其他时间 滞 后 和 移 动 平 均 特 征 的 归 一 化 权 重 均 低 于0.151。由此表明,电力生产与非电力生产时间之间的区别较为重要。因此,预测模型中需要引入电力生产计划这一重要特征14。2.4超参数选择图 2 展示了独立的超参数值对预测性能的影响。文中涉及的超参数包括特征个数、不同算子以及隐藏单元数量15。图2各类因素对预测性能的影响图 2(a)表明,特征个数为 200时,训练集误差显著变大,因此较大的特征集有明显的缺点。因此需要针对每个新数据集调整超参数,从而在给定搜索空间内找到最佳组合16。经过实验可以发现,训练过少会导致训练集和测试集欠拟合。而训练过多则会导致模型过
15、拟合,从而使得测试集性能不佳。因此,该文使用以下策略防止过拟合的发生:一旦验证数据集的性能开始下降,则停止模型训练;图 2的三个超参数对系统影响表明,无法确定具有一般意义的超参数设置规则,这说明需要针对每个新数据集进行超参数调整。3实验验证为了评估此次的混合模型,采用真实数据集进行 训 练。数 据 运 行 环 境 采 用 了 运 行 在 Intel i3-2370MCPU和 2 GB RAM 上的 Matlab计算软件,并使用 2020 年 1-12 月的电力负载值来训练 WNN。同时,采用了 2021 年 1-12 月的数据来测试 WNN。每小时的预测结果如图3所示,Y表示模型输出的百分比误
16、差。基于双层预测模型的百分比误差分别为3.8%和 3.81%,ANN 预测模型的百分比误差分别为2.2%和 2.23%,基于混合预测模型的误差百分比均为1.24%。图3每小时预测误差实验王 运,等面向高渗透率新能源电网的短期负荷预测算法设计-155电子设计工程 2023年第6期每日的预测结果如表 2所示。从表中能够清楚地看到,基于 ANN的预测模型预测未来负荷时偏差最大。与其他两个现有模型相比,所提出的混合预测模型预测未来负荷时偏差最小。基于混合预测模型的短期负载预测算法相比其他两种模型更为准确。表2每日预测误差实验日期编号123456均值ANN预测模型偏差(%)3.993.424.13.673.793.623.76双层预测模型偏差(%)2.41.972.612.131.972.432.25混合预测模型偏差(%)1.041.321.151.441.161.291.23预测策略的准确性与其收敛速度之间存在取舍,双层预测模型提高了预测模型的准确性,但导致收敛速度相对较慢。混合预测模型由于采用并行的结构,在提高预测精度的同时,在执行时间方面并未付出较多的成本。图 4为训练数据样本的数量对预测