1、第 60 卷 第 2 期/2023 年 1 月/激光与光电子学进展0210001-1研究论文优化卷积神经网络超参数的非侵入式电力负荷识别算法赵安军1,赵啸1,荆竞2*,席江涛1,崔朴方11西安建筑科技大学信息与控制工程学院,陕西 西安 710055;2中国建筑西北设计研究院,陕西 西安 710018摘要 针对深度学习模型在电力负荷识别中存在的识别率不高、超参数设置等问题,提出了一种粒子群优化算法(PSO)与卷积神经网络(CNN)相结合的非侵入式电力负荷识别模型(PSO-CNN)。首先,以各电器 VI 轨迹像素化图像作为CNN 输入;其次,分析 CNN 超参数对模型性能影响,并使用 PSO 算法
2、寻求最优解以提升模型识别效果;最后,基于PLAID、WHITED 公开数据集对 PSO-CNN 模型进行对比验证。实验结果表明,该模型的识别准确率、F-measures平均值皆优于其他模型,有效降低了设备之间的混淆,具有良好的识别能力与泛化能力。关键词 图像处理;非侵入式电力负荷识别;深度学习;卷积神经网络;粒子群优化算法中图分类号 Tm714 文献标志码 A DOI:10.3788/LOP212374Non-Intrusive Electric Load Identification Algorithm for Optimizing Convolutional Neural Network
3、Hyper-ParametersZhao Anjun1,Zhao Xiao1,Jing Jing2*,Xi Jiangtao1,Cui Pufang11College of Information and Control Engineering,Xian University of Architecture and Technology,Xian 710055,Shaanxi,China;2China Northwest Architecture Design and Research Institute,Xian 710018,Shaanxi,ChinaAbstract Aiming at
4、the problems of low recognition rate and hyper-parameter setting of deep learning model in electric load recognition,a non-intrusive electric load recognition model(PSO-CNN)combining particle swarm optimization algorithm(PSO)and convolutional neural network(CNN)was proposed.First,the pixelated image
5、 of VI trajectory of each appliance is used as the CNN input feature.Secondly,the influence of CNN hyper-parameter on model performance was analyzed,and PSO algorithm is used to find the optimal solution to improve model recognition effect.Finally,the PLAID and WHITED public datasets were used to co
6、mpare and verify the PSO-CNN model.The experimental results show that the recognition accuracy and average F-measures of this model are better than other models.The model effectively reduces the confusion between devices and has good recognition and generalization ability.Key words image processing;
7、non-intrusive electric load identification;deep learning;convolutional neural network;particle swarm optimization algorithm1引言我国经济的快速发展使得家庭能源消费总量增加1。在家庭能源消耗中,如果向用户反馈其能耗详细信息,用户很可能会作出相应策略以减少能耗2。为监测家庭电能消耗,非侵入式负荷监测(NILM)提供了经济且有效的解决方案,通过功率、电压、电流等丰富负荷特征,NILM 基于机器学习技术对用电总负荷进行分解及识别。国内外学者在 NILM 领域进行了大量的研究工作。
8、部分研究手动设计特征提取器,并将提取的特征作为模型输入进行辨识。文献 3 使用快速傅里叶变换提取设备稳态电流的谐波幅值与相位角作为负荷特征,但此特征难以识别多状态负荷。文献 4 对 VI轨收稿日期:2021-08-27;修回日期:2021-10-22;录用日期:2021-11-08;网络首发日期:2021-12-10基金项目:国家重点研发计划(新型建筑智能化系统平台技术)(2017YFC0704100)通信作者:*0210001-2研究论文第 60 卷 第 2 期/2023 年 1 月/激光与光电子学进展迹表现出的不对称性等 8 种形状特征进行了详细阐述,使用层次聚类方法分别与基于传统功率指标
9、和特征向量方法进行了对比,实验结果表明,VI 轨迹的形状特征对负荷的特性具有明确含义,并具有良好的辨识能力。文献 5 计算 VI轨迹轮廓的椭圆傅里叶描述符,并将其作为分类算法输入。文献 6 在文献 4 基础上提出跨度新特征,使用 4 种分类算法分别与电流谐波含量、有功功率、无功功率进行对比,结果均表明,VI 轨迹具有更好的识别能力。传统的手动设计特征提取器的方式虽取得较好效果,但依赖于先验知识7,并且设计的特征提取器可能对噪声和伪影不具有鲁棒性8。深度学习的快速发展为 NILM 提供了新思路。文献 9 使用 BP 神经网络、卷积神经网络(CNN)分别对功率、VI轨迹进行特征提取、融合,并将此复
10、合特征作为用于负荷识别的新特征。文献 10 将电流信号转换为电流图像形式,利用 CNN 进行特征提取及负荷识别。深度神经网络可充分利用大量负荷数据样本,提取到能更好地表达输入与输出关系的特征。已有研究证明,深度学习模型性能与其超参数设置有着复杂的关系11,但目前没有通用有效的理论来指导超参数的设置。深度学习模型可能花费数天时间进行训练,依赖传统的实验组合方式是低效的、不彻底的,模型也可能不具有最佳识别能力。基于 CNN 强大的提取特征能力,本文尝试使用粒子群优化算法(PSO)对其超参数进行最优查找,并建立了一种 PSO-CNN 负荷识别模型。首先通过高频采样数据提取电器 VI轨迹,并将其转化为
11、像素化图像作为 CNN 输入;在网络训练过程中,使用 PSO 对 CNN主要超参数进行最优查找,并以此结果构建 PSO-CNN 模型进行负荷辨识;最后基于 PLAID、WHITE数据集对该模型进行对比验证。2VI轨迹像素化图像相比其他特征,VI轨迹特征能更好地反映家用电器负荷特性4,6,12-13,因此本研究选取 VI轨迹作为模型输入。在用电设备开启后的规定时间段内,绘制其电压与电流关系曲线得到 VI轨迹。文献 12,14 中,VI轨迹被映射到单元网格中,网格的每个单元被分配一个二进制值表示其是否被轨迹遍历。基于该像素化的VI 图像,提取占用单元的连续数量、左水平单元和中央单元的二进制值等特征
12、作为分类模型的输入12。文献 14 中,像素化图像被重新排列成向量,直接输入分类器进行设备分类。之前的方法将 VI轨迹所包含的信息压缩为有限的相关统计信息,为充分利用 VI轨迹信息,本研究对之前的方法进行了一些改进。与文献 12,14 相比,图像具有连续值而不是二进制值,具体处理步骤如下:1)获取设备在一定工作时间段内的电压 V 和电流 I;2)将电压、电流归一化,V-1,1、I-1,1;vm=Vmmax|V,(1)im=Immax|I,(2)式中:Vm、Im分别表示数据中第 m 个采样点的电压、电流值;max|V|、max|I|分别为数据中电压、电流绝对值的最大值;vm、im分别为第 m 个
13、采样点归一化后的电压、电流值。3)使用归一化的数据创建 VI轨迹;4)使用 nn网格将其覆盖;5)遍历全部采样点,若采样点在网格单元范围内,网格单元值加 1;6)归一化单元格的值,使单元格的最大值为 1。图 1展示了冰箱与节能灯(CFL)的转换对比。3PSO-CNN负荷识别算法3.1卷积神经网络由于 CNN 处理图像的强大优势15-18,本研究建立了基于 CNN 的负荷识别模型,其网络结构如图 2 所示,该 模 型 主 要 由 2 个 卷 积 层、2 个 池 化 层 和 1 个Dropout 层组成:用电设备像素化图像作为模型输入(nn 矩阵,n=50);卷积层用来提取输入信息特征,其与全连接
14、层的主要区别在于卷积层中的每个节点都利用局部连接方式连接输入矩阵的部分区域,这种连接方式保证学习后的卷积核对输入的局部特征具有最强响应。感受野是 CNN 中最重要的概念之一,表示网络内部不同神经元对原图像感受范围的大小,神经元感受野的值越大,其可能蕴含了更为全局、语义层次更高的特征,卷积核大小与步长设置影响特征图内像素点的感受野,从而影响模型特征提取能力19。此外,其数量决定网络是否能多角度分析输入,数量太多可能会导致网络识别能力下降,并且增加网络运算量。池化层对卷积矩阵进行降维和聚合特征操作时有最大池化和平均池化等方法,但在提取特征过程中,最大池化方法会保留更多的局部细节,有利于模型对易混淆
15、电器的识别20,合适的池化核大小、步长设置可以在保留数据信息的基础上降低数据计算复杂度,同时影响特征图内像素点的感受野。在网络训练时,Dropout层通过设置阈值并与某些隐含层节点的权重对比,让特定节点不工作以加快网络运算、防止过拟合,丢失概率的随机设定可能导致模型识别性能不佳。输出层设置 K个节点(K 为不同设备类型数量),使用 softmax函数使节点输出值在 01之间。为使 CNN 具备识别能力,需要大量的训练数据供其学习。训练样本X=(X1,X2,XN)相应标签t=(t1,t2,tN),其中Xi是各设备 VI 轨迹像素化图像,ti0210001-3研究论文第 60 卷 第 2 期/20
16、23 年 1 月/激光与光电子学进展是对应标签的 one-of-K 编码。训练网络的目的是确定权重和偏差以使成本函数最小化,成本函数使用交叉熵函数13:L=-i=1Nk=1Kti,klog yi,k,(3)式中:预测输出yi取决于CNN的所有权重和偏差。L随着N个训练样本的预测输出yi逼近实际输出ti而降低。3.2CNN超参数优化PSO 是 Kennedy 等21开发的一种进化算法,源于对鸟群捕食的行为研究。粒子群优化的主要思想是随机初始化大小为 N 且维数为 D 的粒子群,通过粒子间的协作和信息共享来寻求最优解。PSO 中每个粒子代表一种潜在的解决方案,第i(i=1,2,N)个粒子的位置记为xi=(xi,1,xi,2,xi,D)、速度记为vi=(vi,1,vi,2,vi,D),粒子通过其个体最优(pbest)和全局最优(gbest)来进行更新,当满足停止条件时输出最佳解决方案。粒子的更新过程可描述为xk+1i,d=xki,d+vk+1i,d,(4)vk+1i,d=wvki,d+c1r1(pbestki,d-xki,d)+c2r2(gbestki,d-xki,d),(5)式中:xki,