1、2 0 2 3年 第3 7卷 第4期测 试 技 术 学 报V o l.3 7 N o.4 2 0 2 3(总第1 6 0期)J O U R N A L O F T E S T A N D M E A S U R E M E N T T E C H N O L O G Y(S u m N o.1 6 0)文章编号:1 6 7 1-7 4 4 9(2 0 2 3)0 4-0 2 8 4-0 5 超短期风力发电量预测技术及其比较分析张利平,赵俊梅,刘 丹,陈昌鑫(中北大学 电气与控制工程学院,山西 太原 0 3 0 0 5 1)摘 要:风力发电作为清洁绿色的新能源,是实现“双碳”目标的主力军之一,但
2、是其对新能源消纳系统提出了新要求,故对风力发电量的科学分析和精确预测研究具有现实意义。首先,对风电多维历史数据属性、特点和离群值、噪声平滑等进行分析与预处理,再通过2种回归树集成和4种回归神经网络及其超参数优化算法对不同机组数据进行回归分析,超参数优化运行时间代价较高。回归拟合效果通过5个评价指标进行对比与分析,经过大量仿真实验,证明了三层神经网络的回归模型拟合和预测效果均较好。关键词:回归树集成;回归神经网络;超参数优化;预测技术中图分类号:TM 7 1 5 文献标识码:A d o i:1 0.3 9 6 9/j.i s s n.1 6 7 1-7 4 4 9.2 0 2 3.0 4.0 0
3、 2U l t r a S h o r t T e r m W i n d P o w e r G e n e r a t i o n F o r e c a s t i n g T e c h n o l o g y a n d I t s C o m p a r a t i v e A n a l y s i sZ HA N G L i p i n g,Z HA O J u n m e i,L I U D a n,C H E N C h a n g x i n(S c h o o l o f E l e c t r i c a l a n d C o n t r o l E n g i n
4、 e e r i n g,N o r t h U n i v e r s i t y o f C h i n a,T a i y u a n 0 3 0 0 5 1,C h i n a)A b s t r a c t:A s c l e a n a n d g r e e n n e w e n e r g y,w i n d p o w e r g e n e r a t i o n i s o n e o f t h e m a i n f o r c e s t o a c h i e v e t h e“d o u b l e c a r b o n”g o a l.H o w e v
5、 e r,i t p u t s f o r w a r d n e w r e q u i r e m e n t s f o r t h e n e w e n e r g y c o n s u m p t i o n s y s t e m,s o i t h a s p r a c t i c a l s i g n i f i c a n c e f o r t h e s c i e n t i f i c a n a l y s i s a n d a c c u r a t e p r e d i c t i o n o f w i n d p o w e r g e n e
6、 r a t i o n.F i r s t l y,t h e a t t r i b u t e s,c h a r a c t e r i s t i c s,o u t l i e r s a n d n o i s e s m o o t h i n g o f m u l t i-d i m e n s i o n a l h i s t o r i c a l d a t a o f w i n d p o w e r a r e a n a l y z e d a n d p r e p r o c e s s e d,a n d t h e n t h e d a t a o
7、 f d i f f e r e n t u n i t s a r e r e-g r e s s e d a n d a n a l y z e d t h r o u g h t w o r e g r e s s i o n t r e e e n s e m b l e,f o u r r e g r e s s i o n n e u r a l n e t w o r k s a n d t h e i r s u p e r p a r a m e t e r o p t i m i z a t i o n a l g o r i t h m s.T h e c o s t o
8、 f s u p e r p a r a m e t e r o p t i m i z a t i o n i s h i g h.T h e r e g r e s-s i o n f i t t i n g e f f e c t i s c o m p a r e d a n d a n a l y z e d t h r o u g h f i v e e v a l u a t i o n i n d e x e s.A l a r g e n u m b e r o f s i m u l a-t i o n e x p e r i m e n t s p r o v e d t
9、 h a t t h e r e g r e s s i o n m o d e l f i t t i n g a n d p r e d i c t i o n v e r i f i c a t i o n e f f e c t o f t h e t h r e e-l a y e r n e u r a l n e t w o r k a r e g o o d.K e y w o r d s:r e g r e s s i o n t r e e e n s e m b l e;r e g r e s s i o n n e u r a l n e t w o r k;h y p
10、 e r p a r a m e t r i c o p t i m i z a t i o n;f o r c a s t-i n g t e c h n o l o g y0 引 言国家深入贯彻新发展理念,亟待解决资源高效利用问题,实现绿色低碳发展,逐步推进碳达峰、碳中和的“双碳”工作,处理好发展和环境的关系。新能源的利用是电力行业绿色可持续发展的迫切需求,通过发展风能、太阳能等新能源,建设安全稳定的新能源供给消纳体系,可大大减少化石能源的消耗。风力发电是实现“双碳”的主力军之一,其运行和维护费用较低。我国风电具有巨大的市场,累计和新增装机容量稳居全球前列,陆上风电已是最有发展前景的绿色新
11、能源之一。风电是可再生无污染的清洁能源,但也存在随机性、波动性、间歇性、不稳定性等劣势,根据收稿日期:2 0 2 2-0 6-1 5 基金项目:国家自然科学基金青年基金资助项目(6 2 0 0 1 4 2 8);国家自然科学基金资助项目(6 2 0 0 3 3 1 5)作者简介:张利平(1 9 8 0-),男,讲师,硕士,主要从事机器学习和机器视觉在电气工程中的应用研究。E-m a i l:z h a n g l i p i n g n u c.e d u.c n。风速等因素对发电功率与发电量进行科学预测可以大大提高并网后电力系统的安全稳定。文献1以风速为主要特征,利用随机森林和X G B o
12、 o s t模型进行功率预测,并搭建了系统模型。文献2 利用模糊聚类算法和K-m e a n s聚类算法,以风速特征进行聚类划分,最终获取风速组合和风功率模型。文献3 重点考虑风速、风力和温度等因素,结合灰色模型和神经网络对发电量进行预测。文献4 利用历史数据的相似性,对其进行扩充和修正,以最高、最低风速、温度为特征,使用单元匹配法、数据扩充法、时间序列法进行预测。文献5 以每小时总发电容量为时间序列,对比分析了有无噪声情况下A RMA模型的发电量预测。文献6 利用B P和R B F网络进行数据预测。本文利用不同机器学习算法对风力发电机组的发电量进行科学预测和分析,为并网提供安全保障,进而提高
13、能源利用率和安全性。1 风力发电数据分析和预处理本文选取某区域的风力发电实际相关数据进行发电量预测分析,此数据每隔半小时采集1次,主要属性包括2 2个,根据属性之间的相关性,输入选取1 2个属性作为主要特征,包括风速、功率、发电机转速、叶片角度、环境温度、机舱温度、齿箱温度、绕组温度、齿箱轴1温度、齿箱轴2温度、电机轴承A温度、电机轴承B温度。其中,风速、叶片角度、环境温度为自然环境参数,转速、机舱温度、齿箱温度、绕组温度等为电气设备监测参数,功率为电网类参数。输出为发电量,将其作为预测量,发电量历史数据是累计的。数据时间段为2 0 2 1年1 0月1日0:3 0至2 0 2 2年4月3 0日
14、2 3:0 0,数据采集频率适度,信息量相对丰富,故对于极少数的缺失数据作忽略考虑。风速和风向随机变动,风力发电机工况复杂多变,难免会出现离群值。风电各类数据中离群值可以定义为比上四分位数大1.5 个四分位差以上或比下四分位数小1.5 个四分位差以上的数据元素。为了降低离群值对预测的影响,采用相邻非离群值的线性插值进行填充7。接着,为了降低数据噪声干扰,进行平滑噪声处理,利用启发式确定窗口,窗口沿着每列数据向下滑动,计算每个窗口中数据的平均值8。经过离群值和数据噪声平滑处理后,由于1 2类特征数据属性不尽相同,一般进行数据归一化处理,本文选取标准差规范化。经过标准差规范化后的风力发电数据均值为
15、0,标准差为1。2 回归树集成和回归神经网络机器学习中,包括支持向量机回归、高斯过程回归和回归树等算法,鉴于风力发电数据维度多、数据量大、数据类型复杂等特点,且要进行超短期预测,故采用回归树集成即提升树和装袋树、全连接的前馈神经网络进行预测比较和分析9。回归树集成是由多个回归树的加权组合构成的预测模型,它是对同样任务的多个不同子模型进行训练,在综合考虑不同子模型的预测结果基础上,做出最终的预测回归结论1 0。图 1 为回归树集成示意图。回归树集成的子模型为弱模型,综合多个不同的子模型便为集成模型。提升树和装袋树算法都是基于决策树学习器的。提升树算法通常使用非常浅的树,这种构造使用相对较少的运行
16、时间和内存。提升树为串行方式,训练时依次训练每个弱学习器,重点关注被前面分错的样本,而不是对样本进行独立的随机抽样构造训练集。预测时使用每个弱学习器分别进行回归预测。然而,为了有效精准的预测,提升树可能比装袋树需要更多的数据集合元素。装袋树一般构造深树,这种构造运行时间较长,比提升树占更多内存,预测更为精准。图 1 回归树集成示意图F i g.1 R e g r e s s i o n t r e e e n s e m b l e d i a g r a m2.1 最小二乘提升树最小二乘提升树回归集成过程中,在每一步,回归集成使一个新的学习者适应不同的情况,可以区分观察到响应和所有学习者的先前预测之间的差异。集成适合于最小化均方误差。最小二乘提升树流程如下:设训练集 (xi,yi)ni=1,M为迭代次数,损失函数L(y,F)=(y-F)2/2,Fm(x)为回归函数,h为激活函数,为随机数字,为学习率。1)设置F0(x)=y;2)从m=1开始循环,直至m=M,计算yi=582(总第1 6 0期)超短期风力发电量预测技术及其比较分析(张利平等)yi-Fm-1(xi),i=1,N;3)根据