1、国外电子测量技术北大中文核心期刊 :基于半指数支持向量回归的电力负荷预测王亮王一鸣侯威贺元帅纪超(西安工程大学电子信息学院 西安 ;西安工商学院信息与工程学院 西安 )摘要:在线运行的超短期电力负荷预测用于潮流估计和电网调度,是制订发电计划的基础,具有显著的经济和安全意义。针对传统负荷预测算法对噪声数据的鲁棒性较差,预测精度无法进一步提升的缺陷,建立了一种基于半指数支持向量回归()的电力负荷预测模型。该模型提出了一种非线性的半指数损失函数,以解决负荷数据噪声导致的预测面偏移问题,从数学上泛化原始的铰链损失和硬间隔损失,通过设置不同的模型参数,获得了优于原始模型的分类效果。此外,通过引入对历史信
2、息的挖掘理念,在输入量中加入了对时间的一阶和二阶微分,进一步提高了预测精度。最后通过理想数字模型仿真和使用真实的湖北省电网电力负荷数据进行预测,实验结果表明,提出半指数支持向量回归模型在速度上达到了在线运行的要求,而预测精度比现有方法有明显提高。关键词:电力负荷;预测;支持向量回归;鲁棒性;广义优化问题中图分类号:文献标识码:国家标准学科分类代码:(,;,):,(),:;收稿日期:基金项目:国家自然科学基金()、西安市科技计划项目()资助引言电力负荷预测指的是对一个国家或地区未来的电力系统负荷需求进行预测,给出具体的预报值。负荷预测在电力系统中一直具有重要地位,是电力系统检测、发电计划和战略管
3、理的基础。等的研究表明,负荷预测误差每上升,运行成本将增加一千万英镑。因此不断提高预测精度是电力系统发展的必然要求,负荷预测既北大中文核心期刊国外电子测量技术是一个传统的研究课题,也是当前的研究热点。按照预测周期和机理的不同,负荷预测可以分为中长期预测和短期预测。中长期预测是以年和月为周期的预测,用于制订电力投资战略、长期发电规划、燃煤供应计划;短期预测是以日及更小时间单位为周期的预测,以内的负荷预测又称为超短期预测。短期负荷预测在电网实时调度软件中已得到应用,并且随着以电价为核心的电力市场的发展越来越具有重要意义。本文研究的对象就是在线短期负荷预测。在电力负荷预测方面已有不少研究成果,早在
4、世纪 年代,华北电力大学开发的电力负荷预测系列软件系统通过了我国电力工业部的部级鉴定。清华大学开发的用电需求预测软件已推广到全国 多个网省的 多个供电局。年,美国电科院开发的负荷预测软件 被美国和加拿大 家电力公司使用。一些致力于能源需求预测和智能科学研究的国际组织也举办了世界范围的电力负荷预测竞赛,推动负荷预测技术的发展。年 举办了一次负荷预测竞赛,台湾大学 团队使用支持向量回归()方法取得最好的预测结果。近年来,基于数据驱动的学习型算法在负荷预测方面的研究逐渐增多,成为一种趋势 。马坤隆 建立了一种分布式负荷预测方法,依据余弦距离相似度对 及以上的电网结构进行子网划分,使用神经网络和时间序
5、列方法等建立子网负荷预测模型。商立群等 提出了基于格拉姆施密特正交化与皮尔逊相关性分析相结合的特征选择方法()和改进灰狼算法()优化极限学习机()的短期电力负荷预测模型()。等 提出一种基于门循环单元()网络的单用户负荷预测方法,相比后向传播神经网络()、系统架构演进()、循环神经网络()、长短期记忆()和 等多种神经网络架构,的精度最佳。短期电力负荷预测具有自身明显的特点非线性,电力系统是一个非线性系统,由不同层次的电压网络逐层组成。全网负荷总量变化依赖于整个系统的结构和各个节点的负荷,具有很强的非线性;随机性,电力系统负荷受到各种外界因素的影响,噪声因素无法精确度量,表现出随机性。短期电力
6、负荷预测的特点决定了短期预测本身难度较大,既要求与其他预测一样的高精度,又要求对新数据的快速处理能力,归纳起来就是要求在线运行,快速运算,而这两种要求常常是互相矛盾的。现有基于深度学习的主流算法可以取得良好预测准确率,这得益于其强大的噪声数据建模能力。但是,基于深度学习的方法往往预测速度较低,无法满足实时运行的需求。方法具有良好的在线运行速度,却无法有效表征具有噪声的电力负荷数据。这一背景下,本文将从广义优化问题的角度出发,对支持向量机()模型进行有针对的调整,通过有效的损失函数设计,提高模型鲁棒性,进而在短期电力负荷预测中取得更优性能。基于半指数损失的 模型短期电力负荷数据往往存在噪声,对于
7、噪声数据的极度敏感使得 模型在实际分类问题中的准确率有限。原始的 模型采用线性的铰链损失函数,对于“错误标签”也即是所谓的离群值有着较高的敏感度,在实际电力负荷预测中,往往会因为少量的错误标签数据导致分类面的位置偏移和方向旋转。因此设计了非线性的半指数损失函数来缓解这一缺陷。线性 模型 应用于回归拟合分析时,其基本思想是寻找一个最优分类面使得所有训练样本离最优分类面的误差最小。对于完整数据集,支持向量机试图找到最适合的超平面,它可以将数据集标签最大限度地间隔开来。通常,定义任意超平面为:()()式中:权值向量和偏置量唯一定义超平面。线性支持向量机首先寻找最优超平面,随后根据样本点与超平面的位置
8、关系判断样本归属,表示为:()()对于 正 确 的 分 类,有 ,反 之 ,其中为标签值。定义:分类间隔。对于样本,定义正确分类间隔为:()()根据 的核心思想,希望最大化正确分类间隔,也即针对所有数据点,最大化正确分类间隔 (,)。得到如下优化问题:,(,)(),()式()等价于:(),()()()式中:是预测面误差阈值。一般的 模型可以视为采用硬间隔损失函数的优化模型,其中硬间隔损失函数如下:(),()()()()其中,()代表 模型。不完全可分数据针对不完全可分数据,也即()无法对所有样本成立,若继续采用硬间隔损失函数,当趋向于国外电子测量技术北大中文核心期刊无穷大时则优化问题误解。定义
9、:铰链损失函数。铰链损失函数如下:(),)(),()用铰链损失替换硬间隔损失,令(),),则新的优化模型如下:,(),()式中:为惩罚系数,可以人为调节。软间隔 模型一般利用拉格朗日乘子法求解:()()式中:和是对偶变量。对、分别求偏导,采用梯度下降法即可得到该最优问题的解。半指数损失函数铰链损失基于如下假设:当样本被预测器错误预测时,根据错误样本距离分类面的距离施加线性惩罚,偏离度越大,惩罚越大。而更为原始的硬间隔支持向量机,对于所有的错误预测的样本均施加同等惩罚,也即关注的是对错与否,而不关心错误的程度。这两类假设在部分情况下可以达到较优的效果,但是对于部分特殊的数据集则会被噪声严重影响。
10、本文提出一种折中方案作为支持向量机的损失函数,将之命名为半指数损失。定义:半指数损失函数。半指数损失函数如下:(),)(),()式中:为可调参数。用半指数损失替代铰链损失,有如下新的优化模型,本文称之为半指数 :,(),()证明半指数损失函数可以视为硬间隔损失和铰链损失的泛化损失结如下。不考虑()的定义域部分,此部分类损失函数均为。为简化符号,令()。根据洛必达法则,有:(),即 。代表铰链损失函数。同理有:,即 。代表硬间隔损失函数。这表明采用新的半指数损失可以至少取得与原有模型等优的性能,同时通过调整参数,可以针对不同的噪声情况优化模型,取得更优的效果。从广义优化问题的角度而言,半指数损失
11、函数有着更好的优化特性,作为光滑的损失函数,半指数损失函数可以通过次梯度方法进行优化,而硬间隔损失函数则不具备梯度优化可能,这也正是其在现实中应用较少的原因。作为非线性的损失函数,与铰链损失相比,部分严重偏移噪声的影响会被弱化。作为非线性的损失函数,半指数损失函数对于错分样本施加一个对数减小的惩罚值,能够从数学上泛化原始的铰链损失和硬间隔损失,通过设置不同的模型参数,期望获得优于原始模型的预测效果。半指数损失 的 优化算法半指数损失是一种非线性损失函数,且在特征空间中存在不可微断点,因此直接采用 求解的梯度下降法并不可行。为解决该问题,本文引入了 过程 与次梯度方法来解决不可微半指数损失函数的
12、优化问题。过程在优化问题领域得到了广泛应用。作为一种非凸优化过程,过程通过离散的值迭代过程,实现了系统的全局优化和能量函数的单调下降。可以应用于几乎任何优化问题,并且许多现有的算法都可以用 。综合 过程以及次梯度下降算法,可以通过对半指数损失函数的拆分,实现全局下降的优化。设置随 机 初 始 值(,),这 里 尽 量 使 初 始 值 分配均匀。),进入循环步()()()()()()令:(,)()()()()其中,()和()满足式()和()。()(),()()()()利用次梯度算法求解此时的最优值:北大中文核心期刊国外电子测量技术(,),(,)()令(,)(,)()其中,和是迭代计算的中间参量。
13、),进入循环步次梯度值(,)、(,)设置步长,有:(,)()(,)()当参数更新幅度小于设定下限值或达到最大循环次数时,令(,)(,)跳出循环。当参数更新幅度小于设定下限值或达到最大循环次数时,输出最优值(,),结束循环。回到步骤),重复以上过程足够多次以获得全局最优值。实验数据与评价指标 数据来源于分析电力系统在运行中积累了大量的负荷数据记录,这些记录为预测算法提供了训练数据集,预先对数据进行分析处理和挖掘有用信息有助于提高预测准确性。本文使用湖北省 年全年的负荷数据进行实验仿真,数据每隔 记录一次,每天运行 共记录 个数据。将该数据集一年内的负荷数据,按计算 个负荷值的均值和方差,如图所示
14、。图中纵坐标是负荷数值,横坐标是从月日开始的日期天数,可以看出一年内有两个波动较大的时段。一个明显的用电低谷是春节长假期间,另一个用电高峰是夏季,这两个时段方差也较大。其他时段均值和方差相对平稳。图原始数据的日均值和方差为了预报负荷,需要对负荷数据建立回归模型,模型应包含尽可能多的有用的信息。不同的数据采集方式和处理方式会影响到预测效果。建立模型数据集(,),(,),其中是第个离散时刻的负荷数值,是对应于每一时刻的输入值,或称属性。对于,属性选择应该取自此时刻前的有用信息,初步可以考虑如下信息。)时间序列信息在短期负荷预测中,利用历史负荷数据进行时间序列分析是最常用的方法,研究表明历史负荷数据
15、可以影响和揭示未来的负荷。时间序列指的是把作为预测目标值时,令向量包含若干此前的目标值,把作为属性。这种属性选择方法也称为时间窗,即以一个固定长度为的窗口包含最近的历史数据,每一时刻都将窗口向前平移一步。本文研究的是一步向前预报,假设在时刻,及以前时刻的历史数据已知,这符合工程实际中电力负荷预测的情形。)日历信息根据电力负荷的性质可知,在每天不同时刻表现出相同的波动规律,在一周的工作日和休息日也表现出相似的波谷特点,因此很自然的可以考虑星期信息和时刻信息对负荷的影响。在本文超短期负荷预测中,所采用的训练数据涉及的时间段不超过一个月,星期几及假日相关的信息样本数偏少,因此不作考虑,只考虑时刻信息
16、。本文使用的数据,按采样记录顺序标号,每天的时刻属性可以用序号对取模得到,其值为,记为。)隐含信息负荷数据中可能隐藏着非直观的有用信息,需要通过挖掘才能得到。微分量信息提取观察负荷随时间变化的曲线可以看出,每天的波形相似,具有明显周期性。如能抽象出此波形的特征,将有助于把握负荷随时间变化的规律,提高预测精度。计算出此波形代表的函数对时间的一阶微分,可以了解其变化速率和增减性,其二阶微分可以揭示凸凹性及拐点的信息,这些信息可以表示函数的波形特征和最大最小值,对于提高回归建模的准确性是有价值的。由于负荷的物理模型不易建立,无法直接写出负荷对时间的函数来求导,但是可以通过预先建立一个以时间为输入量的回归模型作为真实模型的近似,为区分起见,将其称为辅助模型,原来所要建立的多维输入量的回归模型称为主模型。一般的时间序列模型采用离散时间方程表示,无法求导,而用高斯核函数表达的回归函数可以表达为指数函数的线性组合,而指数函数是便于求导的。通过建立一个辅助模型的回归函数,对此函数求导,得到的一阶和二阶微分可以用做原回归 函 数的输入。预测精度评价标准对于一个取样点(,),将输入模型的目标函数得到?()