1、电子设计工程Electronic Design Engineering第31卷Vol.31第6期No.62023年3月Mar.2023收稿日期:2021-09-06稿件编号:202109029作者简介:刘晓伟(1983),女,河北张家口人,高级经济师。研究方向:电力营销及供电服务。在互联网技术的影响下,电力企业的运营服务方式也出现了变化1,电力互联网领域涉及到的重复数据具有冗余性,人工处理数据会出现一定的计算失误,影响电力企业的服务质量2。文献3提出了一种基于数据挖掘的电力系统数据分析与决策系统。该系统根据运行人员的需求,在对电网数据库进行数据清理、整理、建模等操作之后,利用网络数据库对相关数
2、据进行关联性分析和预测,挖掘出相应的知识。最终,以可视化方式向操作者展示。文献4提出了一种基于Apriori算法的电力系统二次设备缺陷数据挖掘及分析方法。在充分分析了关联规则和 Apriori算法思想的基础上,建立了基础的电力系统二次设备缺陷模型,通过该模型研究二次设备缺陷的主要属性,以自动设备缺陷数据为例,分析了基于 Apriori算法的电力系统二次设备缺陷数据挖掘与分析方法。为了解决以上提到的电力互联网运行过程中交互数据存在的问题,首先对电力客服数据的特征进行分层融合,然后以电力互联网运行特征为基础,进电力互联网运行过程中重复需求数据挖掘方法刘晓伟,谢 枫,王 莉,介志毅,吕凛杰(国网冀北
3、电力有限公司营销服务中心(计量中心),北京 100045)摘要:目前提出的电力互联网运行过程中重复需求数据挖掘方法挖掘精度较低,导致电力系统稳定性较低。以95598电力客服数据为基础,通过数据决策模型提取重复需求的数据特征,利用数据分层迁移法分析数据特征,完成特征分层融合处理,构建电力数据库模型,采用聚类算法进行重复需求数据的深入挖掘,提取数据信号的信号流,利用决策树实现电力数据的准确校测。实验结果表明,提出的电力互联网运行过程中重复需求数据挖掘方法能够有效降低错误率,提高电力系统稳定性,具有很好的应用性能。关键词:电力互联网;运行过程;重复需求;数据挖掘中图分类号:TP393;TN-9文献标
4、识码:A文章编号:1674-6236(2023)06-0043-05DOI:10.14022/j.issn1674-6236.2023.06.010Data mining method for repeated demand in the operation of electric power lnternetLIU Xiaowei,XIE Feng,WANG Li,JIE Zhiyi,LV Linjie(State Grid Jibei Marketing Service Center(Metrology Center),Beijing 100045,China)Abstract:At pr
5、esent,the repeated demand data mining method in the operation of electric power Internethas low accuracy,which leads to the low stability of power system.Based on 95598 electric powercustomer service data,the data features of repeated demand are extracted by data decision model,thedata features are
6、analyzed by data hierarchical migration method,the feature hierarchical fusionprocessing is completed,the electric power database model is constructed,and the clusteringalgorithm is used for indepth mining of repeated demand data,and the signal flow of data signal isextracted,the decision tree is us
7、ed to realize the accurate calibration of power data.The experimentalresults show that the proposed method can effectively reduce the error rate and improve the stability ofpower system,and has good application performance.Keywords:electric power Internet;operation process;repeated demand;data minin
8、g-43电子设计工程 2023年第6期一步完成基于聚类算法的重复需求数据深入挖掘,达到提高电力企业整体服务质量的目的。最后,通过对比实验证明了该文研究的电力互联网运行过程中重复需求数据挖掘方法具有可行性。1电力客服数据的特征分层融合电力客服的行为最能表现出电力互联网企业的服务质量,电力客服主要的工作是处理电力互联网运行的相关数据,由于电力客服处理的数据具有冗余性和复杂性,为了使得提取的电力客观数据特征具有意义,提高电力客服的处理效率,电力企业在任何工作任务开始、进行和结束都会记录相对应的数据痕迹,存储在数据库内,客服需要在对重复需求数据进行处理时,先对数据进行有效对比,选取的对照数据就是在数据
9、库内调取,此行为也被称为电力客服数据特征提取的预处理操作。构建电力客服数据决策模型,模型的特征提取原理是计算所有的重复需求数据的扩散模糊度,然后按照数据模糊度的数值完成提取。首先将调取的电力互联网运行的需求数据依次分离,每 10组数据作为一个整体进行捆绑处理,然后将数据转化为具有扩散模糊决策计算条件的格式,转化公式如下:c1=u0du(1)其中,c1表示电力互联网运行的决策模糊因子;表示电力互联网运行的决策系统决策量;u0表示电力互联网运行中数据的信息频谱5。电力互联网运行的重复需求数据计算格式转化完成后,带入数据决策模型内,计算出每个数据的重复扩散模糊度,具体模型结构如下:c2=Ju01-H
10、 dHIHdH(2)其中,c2表示电力互联网运行的分析函数决策因子;H表示电力互联网运行的波动值;表示需要计算的重复需求数据的特征值;在模糊判定过程中数据过滤处理回溯变量区间为1.2,8.9,其他未知数同上6。最后将电力客服需求重复的数据完成模糊决策计算后,根据数据模糊程度的相似度,形成一个特征序列集合,然后对初次提取出的电力客服数据特征进行有效筛选,合理地进行电力客服数据特征的提取,输出每个电力客服处理的重复需求数据的特征,具体计算公式如下:p=1-(1-H(x,y)(3)其中,(x,y)为数据扩散模糊的有效计算公共模糊域,其他未知数意义同上7。通过以上的计算就可以提取出电力互联网运行过程中
11、电力客服重复需求数据的特征,接下来完成电力客服数据的分层融合处理。电力客服数据融合总体模型如图1所示。图1电力客服数据融合总体模型根据图 1 可知,其操作流程的处理原理是将需要电力客服处理并且具有重复需求的特征数据按照数据迁移分层法则进行分层融合,达到该文设计的目的。每一个数据决策模型提取出的具有重复需求的电力客服数据特征都具有一个可识别的定位节点作为特征属性,为了使电力客服数据的特征分层结构具有规范性,需要对每个有效特征的节点进行效率计算,计算公式如下:ij=1dij-V-1n=0G(n)e(4)其中,ij表示特征节点之间的效率;dij表示数据特征定位节点间的间距数值;e表示数据特征分层系数
12、;G(n)表示数据特征的适应度函数8。具有需求重复的电力客服数据特征分层结构中各个特征存储的距离十分关键,此距离决定了数据特征之间的适应度,一旦适应度不合适,每个电力客服数据特征会将临近的数据进行无规则销毁9,导致不可挽回的影响,因此将该文研究的电力互联网运行过程中重复需求数据作为背景,设定一个合理的分层存放间距,利用非线性差分相点融合估计算法,将电力客服数据特征的每个层次结构进行融合,得到最佳的数据特征比例数值,非线性差分相点融合估计算法的计算定义如下:-44DR(pi,Ni)=rwd(a,b)PET(pi,Ni)(5)其中,pi表示重复需求数据特征分层融合进程管 理 处 理 机;Ni表 示
13、 特 征 分 层 融 合 的 任 务 量;rwd(a,b)表示需要进行融合的电力服务特征的相对位置向量。2重复需求数据深入挖掘基于聚类算法进行重复需求数据深入挖掘需要在数据库中进行数据分析和特征提取10。对系统数据库进行结构分析,根据数据库的结构层次选用决策树方法进行数据分析,提取数据信号的关键特征,并对数据处理中产生的空间干扰和噪声干扰因素进行模态分解,基于聚类算法实现置信度较高的重复数据深入挖掘。重复需求数据库如图2所示。图2重复需求数据库以重复数据的数据集为运算样本,将不同特征的重复数据划分为多个不同的子数据集11-12,根据子数据集的数据量、数据长度等参数计算部分数据的时间特征:Y=y
14、1,y2,yn(6)式中,Y 为数据的时间特征尺度,n 表示数据长度序列,经过公式运算得到重复数据信号的时间特征尺度,然后进行模态分解处理:a(t)=x2(t)+y2(t)(t)=arctany(t)x(t)(7)式中,a(t)表示重复数据t的数据流,(t)为该数据流的包络特征,经过计算能够得到重复数据的包络矢量参数13。对重复数据集中的所有数据进行包络特征计算,得到所有数据样本的包络矢量,然后基于聚类算法对样本数据包络矢量进行高斯离散,通过特征筛选分解重复数据的信号和特征信息。样本数据的高斯离散运算公式如下:z(t)=x(t)+y(t)=a(t)e(t)(8)式中,z(t)为数据信号的离散分
15、量,x(t)为数据库中初始数据样本的信息离散幅度,y(t)为数据运算采用的离散尺度,结合上一步数据模态分解处理所得的数据包络特征,对数据信号进行卷积分解处理14,并根据所得分解频段波形对重复数据和信号进行固定模态频段特征分量分析:rn-1-cn=rn(9)式中,rn为重复数据的固定模态频段特征信号,cn为重复数据的固定模态频段特征分量。根据得到的信号数值和所有数据信号值变化情况与计算设定的信号值进行对比,满足小于设定数值的幅值即为符合挖掘标准的重复数据,可以进行特征提取和深度挖掘15。通过决策树模型进行重复数据深度挖掘,将已经完成特征分类和信号分析的数据集引入到参数适配的数据处理器中,通过合适
16、的决策树对重复数据进行数据特征识别和相关性检测分析,将检测到的数据信号参数和模态时频特征按照关联关系构建数据特征决策树,源数据与子数据之间通过决策分叉连接。数据聚类过程如图3所示。图3数据聚类过程根据提取出的数据特征,对所有数据进行跟踪,将跟踪数据的参数取值整合为一个数据集,再将对应数据在决策树中所表现出来的映射值整合在一起,将两组数据一一进行映射关系对应,并按照决策树关系的排列顺序构建聚类状态的序列16。在此基础上监测重复数据出现的频率和输出数据的特征信息,进行重复数据挖掘判别,判别公式如下:W=sgn(W)(|W-Ts),|W Ts0,|W Ts(10)式中,W表示数据挖掘的判别结果,为决策树的调节系数,Ts为重复数据的产生频率。经过以上运算以及得到的函数运算结果,能够判定聚类算法下重复需求数据的深度挖掘结果是否达到标准。刘晓伟,等电力互联网运行过程中重复需求数据挖掘方法-45电子设计工程 2023年第6期3实验研究为了验证该文方法的有效性,进行了实验研究,采用基于聚类算法的重复需求数据深入挖掘方法对电力互联网运行过程中的重复需求数据进行挖掘,监测记录数据挖掘过程中的计算错误率。实