1、基于超状态隐马尔可夫模型的智能电能表非侵入式故障远程检定荆臻,王莉,杨梅,王者龙,王晓泳(国网山东省电力公司,济南;山东省计量科学研究院,济南)摘要:存在故障或误差的智能电能表不仅给电网企业带来经济损失,而且其中的安全隐患容易影响电网的稳定运行,尤其是对成分复杂的智能电网体系。针对这一问题,提出一种基于超状态隐马尔可夫模型(o o,)对故障电能表进行非侵入式远程检测与定位。该方法不仅能发现已经出现故障的电能表,还可以对最有可能出现故障的电能表进行估计,为电网企业的运营管理提供参考,在真实数据集上的实验结果验证了该方法的有效性与稳定性。关键词:智能电能表;超状态隐马尔可夫模型;故障检测;概率模型
2、:中图分类号:文献标识码:文章编号:(),o,oo(g cc ,5,g g,5,):o o oo o o o o,o oo o o,o o oo o,o o o oo o o o o()oo o o o o o o o o oo o o o o oo o:,o o,o,o o基金项目:国家电网有限公司科技项目()引 言电能在输配电过程中每年会产生接近 的损耗,给电网企业带来巨大经济损失。电网系统中的电能损失包括技术性损失(o,),即有系统本身导致的不可避免的损失,与非技术性损失(o o,),即人为因素造成的损失。其中,引起非技术性损失的一个主要因素是使用了计量误差较大的智能电能表,这可能是由设
3、备自然老化或者对电表的恶意操纵(如窃电行为)引起的。除了经济上的损失,智能电能表的计量误差和故障还可能导致电网规划和扩建的决策偏差。而在微电网调度等高实时性要求场景下,电表故障也是重要的安全隐患。随着智能电网系统中新成分的增加和复杂程度不断上升,高效的智能电表故障自动检测和定位具有较高的实际意义。针对这些问题,基于超状态隐马尔可夫模型(o o,)提出一种智能电表非侵入式故障远程检定方案,该方法依赖于部署在用户端的智能电能表与一个云数据中心。本文方法不仅能检测智能电能表中的实际故障,还可以预测最第 卷 第 期电测与仪表 年 月 日 ,有可能出现故障的电能表,从而为电力运营商的进一步决策提供参考。
4、方法原理对智能电能表的故障检定已经存在大量研究,典型的有聚类,决策树,随机森林,神经网络以及这些方法的组合或集成模型等。这些方法往往都蕴含着可用数据量大的隐含假设,而在真实场景下,由于数据获取困难或数据隐私安全等原因,实际上可用于模型训练的数据量并不总是足够的。并且,对于故障检定这类问题,还存在着样本分布严重不均,即正样本(故障情形)数远低于负样本(正常情形)数的困境。基于这些原因,本文设计了一种新的处理手段,将一定区域中央电能表计量(作为总耗电量)与单个智能电能表的读数进行比较。该方法可以在具有较少的电能表计量数据的添加下检测出电能表故障。超状态隐马尔可夫模型超状态隐马尔可夫模型()基于经典
5、的隐马尔可夫模型()。已在非侵入式负荷监测,电能质量分析等领域得到了较多应用。在 中,总是假设有一组不可直接观测或测量的状态变量,如图 中的图模型所示。可观测状态隐状态yBBBAAABA1y2y3ytx1x2x3xT图 隐马尔可夫模型的概率图表示 o o o o o一般的 模型形式为:(,Y,)()式中 ,是一组内部状态(隐状态)向量;对应地,Y,是一组可观测状态向量;与 分别为状态转移矩阵(描述 种内部状态中一种状态转化为其他状态的概率)与输出概率矩阵(描述可观测状态的 种不同取值出现的概率),向量 描述了初始时刻处于各个状态的概率分布(图中未绘出)。在超状态的 即 中,允许将若干个单一状态
6、组合成一个超状态,每个超状态的定义都是明确的,且可以重新分解为构成其的单一状态。在故障检定问题中,可以作这样的定义:为一组超状态,为第 个超状态,Y 为一组总用电量向量,为 时刻的中央电能表计量值。由于每个超状态代表单个电表计量的一个唯一组合,因此 的维数由每个用户节点馈线的额定供电和所用电能表设备的分辨率决定。模型的训练在使用 时必须已知初始概率、输出概率和转移概率,这些变量可以通过设备的参数、使用时间等数据来赋予一个预设值,但更合理的做法是从实际数据中估计。首先,通过一定时间内的用电量数据得到一个近似的用电概率质量函数(o o,),定义为:,当 ,其他()式中 表示第 个用户的用电量为 的
7、概率;是对该用户可能的最大供电量。下一步是在中搜索最大值,如果某个点是最大值,则下列条件为真:()()()()()()式中 和 用于降低误将局部最大值作为全局最大值的概率,这两个值可以随着已搜索区域的增大自动地调整。搜索到最大值后,所有的概率值将进行分箱操作,每个“箱子”中标记了该组的最大概率值。由于最大值一般是非等距分布的,因此每组概率的特征既包括概率之和,也包括了左右边界,即:()(),当 ,当 且 ,其他()与:()()()(),当()()()()()(),其他()式中()表示第 个最大值;()和()分别表示其所在组的左右边界,注意位于最左端和最右端的组也被限制在合理范围内。反复按照式(
8、)与式()计算,就可以得到所有组的左右边界位置。假设设第 个用户所在的“箱子”为(),故超第 卷 第 期电测与仪表 年 月 日 ,状态 k 可以由()中的各状态组合得到:k ()()()()于是得到了用于故障检定的 模型:(),(),k()k()式中()是系统在 时刻处于超状态 的概率;表示 时刻实际的超状态;为各超状态之间的转移概率矩阵;矩阵 描述了当观测到 时系统处于 超状态的概率。单个电能表的状态推断根据 中的方法,基于一部分的历史数据便可以估计出 的转移概率矩阵等参数,此时的“超状态”实际上指大量用户节点处部署的智能电表的工作状态的组合。由于超状态是可分解的,利用 自适应算法便可以方便
9、地推断出单个电能表的运行状态估计,在云数据中心中实现对智能电能表的非侵入式远程故障检定。根据 算法,基于当前和最后一次测量值,电能表处于超状态 的概率为:(),()()()实际应用中通常采取一阶马尔可夫假设,因此()可假定为常数,记为,从而在 时刻,式()可以写成(),(),()()()采用极大似然估计(oo o,),可以取令()最大的 作为电表在 时刻的超状态。该计算过程的时间复杂度为 O(c),其中 c 为超状态的数量。相比传统方法,方法的一个显著优势是不要求所有节点都部署智能电表,而是以非侵入的方式实现用电量估计。实验分析 实验设置使用了两个公开的数据集:数据集,包含 个月时长内 个家庭
10、的高分辨率智能电能表计量数据,以及 数据集,包含 年内 个家庭的电能表计量数据。实验中使用的计量包括有功功率、电流、电压等。所考虑的智能电能表状态在计量上表现为 种类型:()无异常状态,计量值可视为真实用电量;()计量值始终为常数;()计量值相对真实用电量以恒定的倍数 放大 缩小;()计量值相对真实用电量以非恒定的倍数放大 缩小;()计量范围故障,即计量值被限制在某个最大值 以下;()计量值存在随机噪声,但相比真实用电量平均下降 上升了 个单位。两类方法:基于统计的方法与基于模型的方法用于比较本文模型的实际效果。统计方法基于离群点检测,即将超过给定阈值的点判定为异常。阈值通常取平均值偏离k 个
11、标准差,在随机选择的 周数据中,数据集上的 k 值最佳取值为 ,数据集的最佳取值为。一般来说,样本所选择的数据时间跨度越大,k 值也相应地变大,以适应数据中的固有偏差。图 显示了 数据集中随机抽取的 名用户在 天内平均用电量的偏移情况,k 值设置为 。图中标出了平均值与被认为是“正常”用户所容许的用电量上下界,因此 号与 号用户的电能表计量被算法判断为异常,其电表存在故障的概率较大。用电量用户编号(W)850800750700650600550500450012345678图 基于离群点检测的故障电表识别示例 o o o o基于统计的方法显然是最直接的一类方法,其缺陷也是显而易见的,即只能检测
12、出使电表计量出现严重偏差的故障,如()类故障。而对于更为复杂的()类故障,电表的计量值尽管在任意时刻都存在误差,但在总体上统计特征(如均值)依然保持不变,则在图 中将不会表现为离群点。类似地,离群点检测方法对于检测()类、()类故障通常也是无效的。基于模型的方法假设了各个用户在长期上看用电量总是在总体上占据稳定的份额,因此可以对于任意用户,可以使用其他用户同期的用电量对该用户的用电量基于一定的模型(如线性模型)进行预测,根据预测值与真实值的偏差判断电能表计量是否存在误差。实验结果评估 方法的性能需要考虑几个因素的影第 卷 第 期电测与仪表 年 月 日 ,响,包括:()训练数据量,用所覆盖的天数
13、表示;()计量数据的分辨率;()所使用的电表计量指标;()模型的稳定性,表征模型在每次检测任务前都需重新训练的必要性,通过模型在若干天后的数据上性能下降的程度来体现。在 数据集以 周和 天为时间步长分别训练 模型,并比较模型在故障检测任务上的平均 值,结果如表 所示。尽管从直观上理解,训练集中的数据量越大,模型的性能应该越好,但由于故障检测问题的特殊性,当数据量较大时,模型在优化时会倾向于“掩盖”异常,即学习到了训练集中与均值偏差较大,但被标记为正常的样本特征,这样反而降低了泛化能力。综合考虑模型泛化效果和复杂程度,本文认为以 周作为训练步长是较合理的方案。表 随训练时间步长的模型性能变化 o
14、 o o o o o 步长 天值统计方法线性模型图 给出了步长取 天时 方法对故障类别划分的混淆矩阵,可以看出,模型在正常电能表与 种故障状态的识别任务上都表现出相当优秀的效果。1234560.80.60.40.20模型分类状态123456实际状态图 模型在故障分类任务上的混淆矩阵 oo o o o 表 显示了分辨率对于 模型检测效果的影响(步长取 天),通过实验发现,为最适宜的分辨率。表 随计量数据分辨率的 模型检测性能变化 o o o o o o o oo分辨率()值表 给出了以 天步长、分辨率一次训练后的模型对于一段时间后的数据的泛化效果。可以看出,方法在训练完成后在 天后的样本上依然具
15、有不错的效果。这说明 故障电表检测模块可以稳定地部署在云数据中心上,而无需频繁地训练,这无疑是该方法的一大优势。表 模型在后续数据上的检测性能 o o o o o 延迟 天 值 结束语文中 介 绍 了 一 种 超 状 态 隐 马 尔 可 夫 模 型()的智能电能表故障远程检定技术。相比传统方法,方法对智能电能表安装量需求更低,并且可以以非侵入的方式实现远程的故障电表识别。实验结果表明,方法在检测准确率上可以满足实际需求,且稳定性较高,适合部署在智能电网云平台上,具有一定实际意义。参 考 文 献 张明明 基于大数据分析的电能损耗预测模型的仿真分析 现代电子技术,():第 卷 第 期电测与仪表 年
16、 月 日 ,o o o oo o o o,():肖永江,于永进,张桂林 基于改进乌燕鸥算法的分布式电源优化配置 电力系统保护与控制,():熊秋 居民用电异常识别系统的研究实现 北京:北京邮电大学,陈启鑫,郑可迪,康重庆,等 异常用电的检测方法:评述与展望 电力系统自动化,():,o,o o oo oo o:ooo o o,():李克明,江亚群,黄世付,等 基于 距离和聚类分析的配电台区低压拓扑结构辨识方法 电力系统保护与控制,():,o o:,:刘紫熠,刘卿,王崇,等 基于智能电表运行故障数据的纵向分析模型 计算机科学,():,o,o o o,():,o o o,黄吉涛,樊博,周媛奉,等 基于随机森林的智能电表故障及寿命预测模型 兵工自动化,():o,o,o,oo o o o o oo,():金阳忻 基于模糊神经网络的电能表误差超差风险预测模型电网技术,():o o ooo o o o o o oo,():高欣,刁新平,刘婧,等 基于模型自适应选择融合的智能电表故障多分类方法 电网技术,():o,o,o oo o o o oo oo,():谢航,赖春羊,曾宏,等 基于 o 的电价波动分