1、 ,研究与设计微型电脑应用 年第 卷第期作者简介:王鹏飞(),男,硕士,工程师,研究方向为电力信息化;汤铭(),男,硕士,工程师,研究方向为电力信息化;杜元翰(),男,硕士,工程师,研究方向为电力信息化;李效龙(),男,本科,研究方向为电力信息化。文章编号:()基于多列神经网络的用电行为自诊断技术研究王鹏飞,汤铭,杜元翰,李效龙(国网江苏省电力有限公司信息通信分公司,江苏,南京 ;国电南瑞科技股份有限公司信息系统集成分公司,江苏,南京 )摘要:为了进一步提升电能计量的整体自诊断管理,使用列相对独立的多列神经网络算法,在有限且不完备数据的基础上,利用全网计量节点提供的上行、下行尖峰平谷计量数据,
2、实现对计量系统故障、用电器配置变更、用户窃电等三大主要可能性做出基于大数据深度挖掘的主动判断。在计量系统故障、用电系统变更、窃电行为影响和总和敏感性方面,该系统较早期方法分别实现了 、的计算效能提升,对未来电力计量系统的整体管理效率提升有积极意义。关键词:用电信息采集;自诊断;数据同构化;多列神经网络;数据升维算法中图分类号:文献标志码:,(,;,):,:;引言当前国内的用电信息采集系统包括居民用电计量系统、企业用电计量系统和变电站负荷流量计量系统。张慧认为居民用电计量系统以居民用电电能表为核心设备,目前国内绝大部分地区均已经普及了实时费控电能表系统,可以将居民用电按照尖峰平谷个时段进行分别计
3、量,当前部分地区开始逐渐普及拥有远程物联网抄表功能和实时录波功能的电能表系统。妙红英等指出企业用电计量系统包括企业用电专变的电流互感器和电压互感器系统支持的用电负荷计量系统,该计量系统与变电站负荷流量计量系统结构相似,但后者结构更为复杂多变,精密度和难度系数也更高。马吉科等在实现用电信息采集系统自诊断功能的过程中,其核心原理为对某一负荷的用电数据特征进行大数据画像,当该画像数据出现突变时,即有可能出现计量系统的故障。但也可能会出现用户大负荷用电器的增撤或者用户实施了窃电行为。使用多列神经网络技术,判断画像数据变化的同时,在不完备数据的前提下,实现对计量系统故障、用电器配置变更、用户窃电等三大主
4、要可能性做出基于大数据深度挖掘的主动判断,是该研究的核心创新点。多列神经网络总体设计部分居民用电计量系统仅可记录每月的用电量数据,所以考察所有计量设备的每月双向分时用电量数据作为该数据挖掘的数据来源,采用综合差值法对上述数据进行升维,研究与设计微型电脑应用 年第 卷第期使单一数据来源条件下的数据细节得到充分展现,解决数据不完备问题。图中,对数据求取以下多次差值,以实现数据的升维。图基于差值法的数据升维方案计算双向尖峰平谷计量数据环比差值,得到个直接环比差值数据;计算双向尖峰平谷计量数据的同比差值,得到个直接同比差值数据;针对上行或者下行数据,计算尖时与峰时数据差值、峰时与平时数据差值、平时与谷
5、时数据差值、谷时与尖时数据差值,得到个计量时段间的差值结果;对本月计量时间段差值结果按照第步和第步,分别计算其环比差值和同比差值,各得到个二次差值数据,共 个二次差值数据。至此,得到 列差值升维数据,使可提供给画像模块的数据量得到充分扩充。基于设计需求,需要对计量系统故障、用电系统变更、窃电行为影响等种计量数据画像变更的影响原因作出判断,所以构建列相对独立的多列神经网络进行数据挖掘分析。每列神经网络构建结构个相同但独立运行的神经网络模块。最终分别输出个二值化结果。该架构如图所示。图多列神经网络架构图图中,未对 列输入数据进行模糊化处理,其原因为该 列输入结果的量纲统一为,可以在输入神经网络时将
6、其强制转化为最适应神经网络运行的双精度浮点变量()格式,神经网络之间和神经网络节点之间的数据传导,也采用双精度浮点变量()格式数据。经过二值化模块输出的数据虽然收敛到 和 附近,但其数据结构仍然为双精度浮点变量()格式,需要在后续故障判断模块 中给出 如 式()的 判 断 过 程 将 其 整 理 为 逻 辑 型变量,.,.,.,()式中,当神经网络输出值大于 时,故障判断模块输出逻辑真值(格式),当神经网络输出值小于 时,故障判断模块输出逻辑假值(格式),当神经网络输出值介于 和 之间时,认为该神经网络模块未有效收敛,该神经网络模块自身故障。即该神经网络模块可能存在种自身故障模式。()其中列输
7、出的二值化结果介于 和 之间。()同时出现列或列输出的二值化结果大于 。在对该神经网络模块进行数据训练时,应确保在多次判断过程中,均不出现上述种自身故障,方认为该神经网络在训练中充分收敛。多列神经网络的模块细节设计上述多列神经网络整体设计中,每列神经网络模块均包含个降维模块和个二值化模块。列神经网络中,对应的降维模块和二值化模块内部结构相同但训练收敛过程中的待回归变量赋值内容不同,以形成对种不同计量系统故障原因的判断功能。以下讨论该降维模块和二值化模块的设计过程。()降维模块降维模块将经过前置基于差值法升维计算的 列数据进行降维处理,输出个双精度浮点型变量(格式),因为数据降维过程会造成大比例
8、的信息损失,损失信息量需要使用降维模块的待回归变量进行消化。所以,常规降维模块的节点设计采用多项式回归函数,其基函数如式():()式中,为输入变量集中的第个输入量,为节点输出量,为多项式阶数,为第阶多项式的待回归系数。因为该多项式回归函数拥有个待回归系数,所以能有效的处理数据降维过程中的信息损失量。借鉴相关研究的设计方案,采用 的降维压缩率,每一层隐藏层将数据维度压缩,故形成表中的降维模块分层架构。表降维模块分层架构设计参数表神经网络层次节点量输入数据量节点函数输入层 第层 第层 六阶多项式第层 输出层 表中,除输入层和输出层外,共设计层隐藏层架构,隐藏层共包含 个节点,整个模块共包含 个节点
9、。所有节点均采用式()的六阶多项式回归函数进行节点设计。该降维模块 输 出 的 数 据,输 入 到 二 值 化 模 块 中 进 行 二 值 化处理。()二值化模块二值化模块的统计学意义在于使降维模块输出的结果实现二值化,即使其投影向 或 进行偏移。与降维模块需要的较大数据处理量不同,二值化模块的设计较为 ,研究与设计微型电脑应用 年第 卷第期简单,数据挖掘需求较为单一。大部分数据投影整理工作均交由降维模块处理,二值化模块仅提供一次后置的数据重投影处理。二值化模块采用二值化函数进行节点设计,其节点基函数可写作式():()()式中,为输入变量集中的第个输入量,为节点输出量,为自然常数,此处取近似值
10、 ,、为节点待回归系数。因为二值化模块无数据升维与降维操作,其隐藏层设计目的为确保模块内拥有足够的待回归系数资源,且使该模块占用的算力资源足够小。所以,该二值化模块的架构设计采用表方案。表二值化模块分层架构设计参数表神经网络层次节点量输入数据量节点函数输入层 第层 第层 二值化第层 输出层 表中,该二值化模块的输入层和输出层均为个节点,隐藏层分别包含个、个、个节点,整个模块含输入层输出层在内,共包含 个节点,所有节点均采用式()二值化函数进行节点设计。数据仿真验证结果该系统在早期系统中并无可参照系统作为仿真验证参照组数据。本实验对比的早期方法指,对居民用电计量系统、企业用电计量系统、变电站负荷
11、流量计量系统进行分别管理,利用较为复杂的工作流程,特别借助计量人员的现场确认和设备拆检确认故障类型。所以,仿真验证参照组数据来自早期计量稽查工作的综合日志数据。观察组数据来自该系统经过充分训练收敛后,带入近年相关数据进行数据仿真运行,从而确定其实际数据挖掘效能。仿真系统为电力 系统中的 模块,该模块在电力管理信息系统验证中属于成熟技术,具有较强的稳定性和可用性。判断人工介入的早期判读结果和该系统给出的判读结果,可以得到表中的仿真验证对比数据。表判断敏感性仿真验证对比数据分组计量系统故障用电系统变更窃电行为影响综合敏感性早期方法 该系统 表中,值来源与使用 对仿真数据进行双变量校验的直接输出结果
12、,该结果小于 时,认为数据存在统计学差异,且值越小,认为数据差异性越大。值来源为使用 对仿真数据进行双变量校验的 变量输出值,当 时,认为该双变量校验结果处于置信空间内,当 时,认为该双变量校验结果具有显著的统计学意义。经过分析,上述组比较结果中,均出现 ,的分析结果,证实该系统较早期方法有显著的统计学差异。在计量系统故障、用电系统变更、窃电行为影响和总和敏感性方面,该系统较早期方法分别实现了 、的计算效能提升。总结使用多列神经网络系统可以将功能细分化,在仅考察电能计量系统的上行和下行计量结果中的每月尖峰平谷分时数据,即可判断计量系统的主要故障,给出该故障的实际原因。该系统投入使用后,针对居民
13、、厂矿企业、变电站的计量系统故障自诊断管理将实现统一化,对未来电力计量系统的整体管理效率提升有积极意义。参考文献张慧 关口电能计量装置故障诊断技术 中国科技信息,():妙红英,李蒙,王艳芹,等利用大数据实现电能计量装置运 行 状 态 质 量 评 估 电 力 大 数 据,():马吉科,尹飞,祝永晋,等一种应用半监督学习的计量装置运行状态辨识方法计算机与现代化,():,:,():卫炽光,罗婷,梁永安电费差错诊断与客户行为关联分析 电力与能源,():郝方舟,孙奇珍,沈超,等基于高维随机矩阵的配电网用户侧用电行为分析广东电力,():史玉良,荣以平,朱伟义基于用电特征分析的窃电行为识别方法 计 算 机 研 究 与 发 展,():,():,(收稿日期:)