收藏 分享(赏)

基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型_于晓要.pdf

上传人:哎呦****中 文档编号:2378753 上传时间:2023-05-14 格式:PDF 页数:11 大小:2.72MB
下载 相关 举报
基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型_于晓要.pdf_第1页
第1页 / 共11页
基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型_于晓要.pdf_第2页
第2页 / 共11页
基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型_于晓要.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 40 卷第 3 期计算机应用与软件Vol.40 No 32023 年 3 月Computer Applications and SoftwareMar 2023基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型于晓要李娜(商丘工学院河南 商丘 476000)收稿日期:2020 02 25。于晓要,讲师,主研领域:粗糙集理论及其应用。李娜,讲师。摘要针对风速的不确定性、时变和非线性特征,提出一种用于风速预测的基于受限玻尔兹曼机和粗糙集理论的区间概率分布学习(Interval Probability Distribution Learning,IPDL)模型。该模型包含一组区间隐藏变量,利用 G

2、ibbs 抽样和对比散度来获取风速的概率分布,结合模糊 II 型推理系统(Fuzzy Type II Inference System,FT2IS),设计一个有监督回归的实值区间深度置信网络(Interval Deep Belief Network,IDBN)。算例结果表明,该方法结合了 IPDL 和 FT2IS 的鲁棒性,风速预测性能较好。关键词受限玻尔兹曼机粗糙集理论风速预测区间概率分布学习人工神经网络中图分类号TP3TM76文献标志码ADOI:10 3969/j issn 1000-386x 2023 03 025INTEVAL POBABILITY PEDICTION MODEL FO

3、 WIND SPEED BASED ONESTICTED BOLTZMANN MACHINE AND OUGH SETYu XiaoyaoLi Na(Shangqiu Institute of Technology,Shangqiu 476000,Henan,China)AbstractIn view of the uncertainty,time-varying and nonlinear characteristics of wind speed,this paper proposesan interval probability distribution learning(IPDL)mo

4、del based on restricted Boltzmann machine and rough set theory forwind speed prediction The model contained a set of interval potential variables It used Gibbs sampling and contrastivedivergence to obtain the probability distribution of wind speed Combined with the fuzzy type II information system(F

5、T2IS),we designed an interval deep belief network(IDBN)with supervised regression The example results show thatthe proposed method combines the robustness of IPDL and FT2IS,and its wind speed prediction performance is betterKeywordsestricted Boltzmann machineough set theoryWind speed predictionInter

6、val probability distributionlearningArtificial neural network0引言近年来,风能作为清洁能源受到了广泛关注,全球风电装机容量逐年增长。风力发电的稳定性和可靠性是需要考虑的关键问题,因此,有必要进行风电预测。由于风电预测依赖于大气气象学和风速,因此提高风速预测的准确性能改善风电预测结果1。由于风速数据具有随机性和混沌性,用线性方法预测相当困难2。一般预测时间长短与预测准确性呈负相关关系,根据预测时间可分为超短期、短期和中长期预测。风速预测方法主要有持续性模型、基于气象参数预测、统计学方法和基于机器学习的预测方法等。通常持续性模型对目标函

7、数作简单的平滑假设,未来风速被认为等于预测时间内的风速3,这是最简单和最经济的风力预测方法。当预测时间范围延长时,持续性模型的性能迅速下降,因此,只适用于超短期预测。数值天气预测(Numerical Weather Prediction,NWP)适用于大规模地区长期预测4,主要缺点是计算时间和复杂度高,在预测过程中遇到不可测误差会导致严重的偏差,短期预测不可靠。统计学方法旨在找出风速时间序列统计分布规律和随机过程来把握趋势性非平稳变化。统计模型以各种回归预测为主,包括多元线性/非线性回归、自回归(Auto egressive,A)、自回归158计算机应用与软件2023 年移动平均(Auto e

8、gressive Moving Average,AMA)、自回归综合移动平均(Auto egressive Integrated MovingAverage,AIMA)。文献 5应用多变量 AMA 进行逐时风速预测,但由于其中的线性假设,它无法对较长的时间范围给出准确的估计。文献 6 充分考虑风速自身高低及风速变化率对条件方差的影响,提出一种基于 AIMA 和广义自回归条件异方差模型的风速预测方法,可快速实现超短期内风速的点预测与区间预测。近年来,提出的基于机器学习的短期风速预测方法主要有模糊逻辑7、人工神经网络8 和支持向量机(Support Vector Machine,SVM)9。人 工

9、 神 经 网 络(Artificial Neural Network,ANN)应用广泛,它能够捕捉输入数据与预测风速值之间的关系8。现有研究提出了前馈神经网络10、递归神经网络11、径向基函数(adial Basis Function,BF)神经网络12、自适应小波神经网络13和非线性自回归神经网络(nonlinearautoregressive networks,NANN)14 用于风速和风力发电预测。基于人工神经网络的预测方法由于能够反映输入输出变量之间复杂的非线性关系,在时序预测中得到了广泛应用。人工智能方法可分为浅层和深度学习模型。前馈神经网络等浅层模型利用单隐层来捕获时间特征,这种模

10、型无法从数据中自动学习无监督的特征。深度学习能够训练多层隐藏计算单元,具有很高的泛化能力。文献 15将深度叠加自动编码器(Stacked Auto-Encoder,SAE)应用于短期风电预测。文献 16采用深度置信网络(Deep Belief Network,DBN)进行短期风场预测。DBN 和 SAE 可利用无监督的数据来初始化模型参数。文献 17指出当深度网络的验证错误率很小时,即使网络容量大、复杂度高、最小值很小,也能保证网络具有很好的泛化能力。各种回归方法所作的预测具有不确定性12,现有方法通常假设输入变量服从伯努利分布,没有对实值数据建模,为此,本文提出一种新的区间概率分布学习模型(

11、IPDL),基于受限玻尔兹曼机(estricted Boltz-mann Machines,BM)18 和粗糙集理论19 从底层输入时间序列中获取区间无监督特征。在风速时间序列数据集中,通过降低能量函数,同时增加观测输入向量的概率来学习概率分布函数。可见层和隐藏层的条件概率可以很容易地分解为简单的因子,计算量小。此外,为了有效地训练 IPDL 模型,提出一种基于对比散度和Gibbs 抽样的无监督学习算法。在此基础上,提出一种具有实值输入向量的区间深度置信网络(IDBN),利用IPDL 来获得风场数据的概率分布。利用 IDBN 和FT2IS 设计一种混合风速预测方法,称为深度混合(Deep Hy

12、brid,DH)方法,用于未来风速值的有监督回归。与基于监督回归的 ANN、SV 和模糊系统等人工智能方法不同,特征提取不需要关于风力数据的先验知识。此外,仿真结果表明,该方法能够准确地处理输入数据的不确定性。1风速数据分析风速是具有许多波动的非线性时间序列,因此,基于平滑性假设的方法存在诸多不足。本文基于数据驱动,从输入的风速数据中捕捉统计特征。文献 19 应用自相关函数(Autocorrelation Function,ACF)来获得不同时间样本下风速时间序列的相关性。由于 ACF只能计算一个变量与自身的线性相关性,引入互信息(Mutual Information,MI)处理风速数据高度非

13、线性。假设两个随机变量 X、Y,X 的熵由 H(X)表示,联合熵H(X,Y)用于计算其不确定度。用条件熵 H(YX)=H(X,Y)H(X)表示在已知变量 X 时 Y 的不确定度。两个随机变量之间的 MI 是一个非线性函数,用于测量已知一个变量时,另一变量的信息。MI 由 I(X,Y)=H(Y)H(YX)计算。t 时间的风速值为 v(t),计算v(t l+1)和 v(t+1)之间的 MI 作为时滞。将 MI 大于阈值 0 的时滞对应的风速数据作为算法的输入集,以突出风速时间序列中的相关性。2区间概率分布学习2 1粗糙特征提取粗糙集理论是一种处理不确定性的数学方法。信息系统由 4 元组 U,A,V

14、,f 表示,其中:原始对象 U 是一个有限非空集;A 是一个包含属性的有限非空集;每个属性 aA 都与集合 Va和 V=aAVaS 相关联,V=aAVaS 表示一个 f:U AV 的总信息函数,并且对于 aA 和 xU,f(x,a)Va。假设 MA,那么 x,yU 在 S 中由集合 M 彼此不可分辨。如果当且仅当对于每个 aM,f(x,a)=f(y,a)。MA 在 U 上有一个二元不可分辨关系 IND(M)。粗糙集理论定义了任意对象集 XU 和属性集 MA 的两种近似。利用 M,X可以用MX和MX来近似表示:MXX=OUM:OX(1)MX=OUM:OX(2)BNDM(X)=MX MX(3)第

15、3 期于晓要,等:基于受限玻尔兹曼机和粗糙集的风速区间概率预测模型159式中:MX是对象 U 的集合,就属性集 M 而言,它可能被分类为 X;BNDM(X)描述 X 的模糊性。如果 BNDM(X)=,那么 X 相对于 M 是精确的,如果 BNDM(X),那么 X 被称为粗糙集。2 2区间分布学习模型区间概率分布学习如图 1 所示,利用具有可观测单元的可见层和隐藏层来学习输入向量 xD的概率分布。隐藏层 hH通过捕获 h 内 x 的最重要特征来降低输入数据的维数。利用粗糙集理论的思路,隐单元 h 分别用 h 和 h 表示的上下界估计来逼近。每个特征 h 是 h 和 h 的线性组合,因此,在隐层的

16、第 j 单元可以通过具有每个隐藏单元系数 j和 j来计算,hj=jhj+jhj。所提出的 IPLD 具有以下能量函数:E(x,h,h;,)=(hTWx+hTWx)cTx (bTh+bTh)(4)式中:W 和 W 分别是上界和下界权重;c 是输入向量的偏差向量;b、b 分别是 h 的上界、下界偏差近似值;系数 和 为上下界隐向量对在输出 h 的权重。则能量函数表示为:E(x,h,h;,)=(jkjWj,khjxk+jkjWj,khjxk)kckxk(jjbjhj+jjbjhj)(5)式中:指数 1jH 和 1kD 分别对应隐层单元和可见单元。定义联合概率分布函数为:P(x,h,h;,)=exp(E(x,h,h;,)/Z(6)式中:Z 是一个分区函数,它将(x,h,h)概率和标准化为 1。当某对象能量较大时,它发生的概率较小,而与式(6)中的低能量相关联的概率较大。当(x,h,h)的能量降低时,其在模型中的可能性增加。因此,如果模型通过学习 h 和 h 的值来减少数据集中样本的观测能量,则能获得输入的分布。可见层与隐藏层节点集间相互独立,可见层与隐藏层间节点由特定路径分开(隐藏单元系数),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2