1、电 力 系 统 及 其 自 动 化 学 报Proceedings of the CSU-EPSA第 35 卷 第 6 期2023 年 6 月Vol.35 No.6Jun.2023多源数据驱动的电动汽车用户识别方法刘艳丽,王俊毅(天津大学智能电网教育部重点实验室,天津 300072)摘要:随着电动汽车的不断普及,如何准确获取电动汽车的充电行为并对电动汽车进行针对性管理与调控,成为电网管理人员关注的问题。本文提出多源数据驱动的电动汽车用户识别方法,基于家庭用电数据和电动汽车充电桩数据挖掘家庭用电行为与电动汽车出行规律,以及电动汽车与家庭用户特性的关联程度,建立适用于特定数据场景下的电动汽车用户关联
2、识别匹配参数,从而识别家庭用户与电动汽车之间的关联性并确定电动汽车的最佳归属。最后,通过算例验证了本文方法的有效性。关键词:电动汽车;用户识别;数据分析;关联匹配中图分类号:TM714文献标志码:A文章编号:1003-8930(2023)06-0141-07DOI:10.19635/ki.csu-epsa.001143Multi-source Data-driven Based Electric Vehicle User Identification MethodLIU Yanli,WANG Junyi(Key Laboratory of Smart Grid of Ministry of E
3、ducation,Tianjin University,Tianjin 300072,China)Abstract:With the increasing popularity of electric vehicles(EVs),how to accurately obtain the information about thecharging behaviors of EVs and thus effectively manage and regulate them has become a concern for power grid managers.In this paper,a mu
4、lti-source data-driven based EV user identification method is proposed.Based on the householdelectricity consumption data and EV charging pile data,the electricity consumption behaviors of household and EV traffic rules are mined.Then,based on the correlations between EVs and household user characte
5、ristics,the correlationmatching parameters suitable for specific data scenarios are established,thereby identifying the correlations betweenhousehold users and EVs and determining the best ownership of EVs.Finally,the results of a case study validate the effectiveness of the proposed method.Keywords
6、:electric vehicle(EV);user identification;data analysis;correlation matching电动汽车充电负荷的时空分布具有很大的随机性,随着电动汽车保有量的逐年提升,电动汽车与电力系统之间的耦合日益紧密,随机分布的负荷给电力系统的安全运行带来了重大挑战。如何准确分析电动汽车的用户行为,已经成为学者们重点关注的问题1-2。目前有关电动汽车用户行为的研究方法可以分为整体性研究方法和粒子性研究方法两种。整体性研究方法是对一定数量电动汽车的整体充电行为进行分析与优化3-9,忽略了不同电动汽车用户行为之间的差异。粒子性研究方法是分别考虑每辆电动
7、汽车行为特性的具体特点,并结合概率抽样10-12、交通模拟13-17、大数据处理18-22等方法,获取每辆电动汽车的用户行为,与整体性研究策略相比,粒子性研究策略对电动汽车用户行为的分析结果更加准确。上述两种研究方法都是直接从电动汽车的角度出发分析电动汽车用户行为,忽略了电动汽车用户的家庭生活行为与电动汽车用户行为之间的耦合关系。根据电动汽车充电行为与电动汽车用户的家庭用电行为之间的相互影响与制约3-4,可以识别出电动汽车的归属。基于电动汽车用户的家庭用电行为对电动汽车的出行规律进行分析与预测,可以避免复杂交通路网的构建及优化问题的求解,提高电动汽车用户行为分析结果的准确度,并根据研究结果制定
8、合理、有针对性的电动汽车充电协调机制,可以高效开展车辆到电网 V2G(vehicle togrid)与电网到车辆G2V(grid to vehicle)等应用,同时也可以帮助电网管理人员对未来大规模电动汽车进行有效管理与调控。然而,由于实际中大多数电动汽车是通过小区公共充电桩充电,现有非侵入式和侵入式家庭负荷收稿日期:2022-08-18;修回日期:2022-10-18网络出版时间:2022-11-17 17:09:39刘艳丽等:多源数据驱动的电动汽车用户识别方法电 力 系 统 及 其 自 动 化 学 报142第 6 期辨识方法无法直接适用于电动汽车用户识别场景。近年来,随着数据采集技术与智能
9、交通系统的发展,大量的家庭用电数据和电动汽车充电桩充电数据为充分挖掘数据的价值、识别电动汽车的归属提供了良好的条件。为此,本文提出多源数据驱动的电动汽车用户识别方法,基于家庭用电数据和电动汽车充电桩数据挖掘家庭用电行为与电动汽车出行规律,识别用户与电动汽车之间的关联性,从而确定电动汽车的归属。1总体框架1.1基本原则多源数据驱动的电动汽车用户识别方法的基本原则为首先提取长期历史用电数据背后蕴含的用户用电特性及用电规律,基于电动汽车与家庭用户特性的关联程度(图1)建立适用于特定数据场景下的电动汽车用户关联识别匹配参数;然后,为了更加准确地提取用户特征、判断用户行为模式,将1 d分为4个时段,分别
10、计算用户行为模式的差异。1.2方法框架本文方法的基本流程如图2所示。基于多阶段分析的思想分别考虑生活行为的宏观特征与细节特征,根据不同特征分阶段建立关联匹配参数,逐步缩小家庭用户与电动汽车的匹配范围,最终确定家庭用户与电动汽车的最佳匹配组合。具体步骤如下。步骤1为每辆电动汽车建立最优匹配集合。步骤2对于每辆需要进行用户识别的电动汽车,在最优匹配集的基础上,考虑电动汽车与该车对应的家庭集中各家庭用户生活行为的宏观特征,剔除掉与该电动汽车的用户特性在宏观上存在明显差异的家庭。步骤3对于每辆需要进行用户识别的电动汽车,在二次筛选后的最优匹配集的基础上,考虑生活行为细节特征,基于细节用户特性构建关联匹
11、配参数,进一步筛选以确定最佳匹配组合。2多源数据驱动的电动汽车用户识别方法2.1初步识别阶段对于每辆进行用户识别的电动汽车,首先计算出电动汽车i的充电记录总数量Tc(i)及电动汽车发生充电行为时小区中家庭 j 的用电记录总数量Tf(j),并引入关联匹配参数,即电动汽车i与家庭j用户生活行为的重合度W0(i,j),可表示为W0(i,j)=Tf(j)Tc(i)(1)式中,W0(i,j)为0表示处于初步识别阶段。首先,根据电动汽车i与家庭j用户生活行为的重合度的计算结果,筛选出所有满足下式的家庭:W0(i,j)max(W0)0.6(2)式中,max(W0)表示不同家庭关联匹配参数W0(i,j)计算结
12、果的最大值。然后,将满足式(2)的家庭构成集合H1(i),作为电动汽车用户识别方法中为每辆需要进行用户识图 1电动汽车与家庭用户之间的互动Fig.1Interactions between EV and household user信息能量图 2本文方法基本流程Fig.2Overall process of the proposed method开始输入多源数据计算W0最优匹配集建立原则计算关联匹配参数R3、R4(行为特性分布相似度)计算关联匹配参数R1、R2(行为特性占比契合度)计算Sum1=R1+R2+R3+R4最优匹配集二次筛选原则计算关联参数R9(用电习惯相似度)计算关联参数R7、R8
13、(极大特性区间关联度)计算关联参数R5、R6(生活行为峰度契合度)计算Sum2=R5+R6+R7+R8+R9最佳匹配组合确定原则结束最优匹配集建立阶段最优匹配集二次筛选阶段最优匹配组合确定阶段刘艳丽等:多源数据驱动的电动汽车用户识别方法143第 35 卷别的电动汽车建立的匹配家庭集,从而初步剔除掉一部分家庭,以提高电动汽车用户识别方法的整体效率。2.2二次筛选阶段2.2.1各时段生活行为占比契合度为了分析电动汽车各时段接入行为占比与家庭各时段回家行为占比的契合程度,构建匹配参数R1和R2分别为R1=W0(i,j)3(2k+2-2k=0)&(2k+1-2k-1=0)&(2k=2k-1)0(2k+
14、2-2k=0)&(2k+1-2k-1=0)&(2k2k-1)W0(i,j)3k=13sgn(2k+2-2k)(2k+1-2k-1)min(|2k+2-2k|,|2k+1-2k-1|)max(|2k+2-2k|,|2k+1-2k-1|)其他(3)R2=W0(i,j)3(2k+2-2k=0)&(2k+1-2k-1=0)&(2k=2k-1)0(2k+2-2k=0)&(2k+1-2k-1=0)&(2k2k-1)W0(i,j)3k=13sgn(2k+2-2k)(2k+1-2k-1)min(|2k+2-2k|,|2k+1-2k-1|)max(|2k+2-2k|,|2k+1-2k-1|)其他(4)式中,2k
15、+2,2k,2k+1,2k-1与2k+2,2k,2k+1,2k-1为k取不同值时不同的生活行为占比指标,其中k表示相邻时段数,1,3,5,7为电动汽车用电记录所反映出的各时段的接入行为占比组合,2,4,6,8为家庭用电记录所反映出的各时段回家行为占比组合,1,3,5,7为电动汽车用电记录所反映出的各时段的离开行为占比组合,2,4,6,8为家庭用电记录所反映出的各时段的离家行为占比组合。2.2.2各时段行为特性分布的相似度对于拥有电动汽车的家庭,其家庭回家行为在某时段的分布情况与电动汽车接入行为在某时段的分布情况之间的相似程度最高,且高于其他家庭的回家行为在对应时段的分布情况与电动汽车接入行为的
16、分布情况之间的相似程度,因此定义关联匹配参数R3和R4分别为R3=0 mind(:,Sa,j)=0&sum(d(Sa,i,Sa,j)=0W0(i,j)a=141-d(Sa,i,Sa,j)mind(:,Sa,j)=0&sum(d(Sa,i,Sa,j)0W0(i,j)a=14mind(:,Sa,j)d(Sa,i,Sa,j)其他(5)R4=0 mind(:,Fa,j)=0&sum(d(Fa,i,Fa,j)=0W0(i,j)a=141-d(Sa,i,Sa,j)mind(:,Fa,j)=0&sum(d(Fa,i,Fa,j)0W0(i,j)a=14mind(:,Fa,j)d(Fa,i,Fa,j)其他(6)式中:a表示不同时段;Sa,i为a时段电动汽车i接入时间;Fa,i为a时段电动汽车i的离开时间;Sa,j为a时段家庭j回家时间;Fa,j为a时段家庭j离家时间;d()表示电动汽车某行为特性分布与家庭用户某行为特性分布之间的KL散度(相对熵)。KL散度是行为统计学中用于量化两个行为特性分布之间相似度的一种方法,KL散度结果越小,两个行为特性分布的相似程度越大。通过匹配参数R3可以分析出家庭的回家行为