1、第 40 卷第 12 期2022 年 12 月环境工程Environmental EngineeringVol40No12Dec2022收稿日期:20220328基金项目:中国工程院重大咨询研究项目(2020-ZD-18-5)第一作者:赵金辉(1981),男,副教授,主要研究方向为节能低碳及能源高效利用。zhaojinhui zzueducn*通信作者:李景顺(1999),男,本科,能源与动力工程专业。Li_Jingshun123 163comDOI:10.13205/jhjgc202212020赵金辉,李景顺,王潘乐,等 基于 Lasso-BP 神经网络模型的河南省碳达峰路径研究 J 环境工
2、程,2022,40(12):151156,164基于 Lasso-BP 神经网络模型的河南省碳达峰路径研究赵金辉李景顺*王潘乐侯高杰(郑州大学 机械与动力工程学院,郑州 450001)摘要:为探索河南省碳达峰路径,满足河南省碳达峰战略需求,选取河南省 20012020 年社会、经济、能耗、资源 4 个维度的 12 个指标,使用 Lasso-BP 神经网络方法,建立河南省碳排放量预测模型。基于 12 个指标数据的回归分析,设计了 6 条发展路径,对河南省 20212035 年的碳排放量进行预测。结果表明:1)12 个维度的因素中,影响碳达峰的 6大关键因素为煤炭消费占比、单位 GDP 能耗、森林
3、覆盖率、能源消费总量、第二产业 GDP 比重和私人汽车拥有量;2)追求单因素发展的路径 14 均无法在 2030 年实现碳达峰;在路径 5、6 下,河南省将于 2029 年碳达峰,相较于路径5,路径 6 的峰值排放量低 2.53 Mt,峰值为 510.91 Mt CO2;3)为实现碳达峰,在“十四五”和“十五五”阶段,应分别将煤炭消费占比、单位 GDP 能耗、森林覆盖率、能源消费总量、第二产业 GDP 比重、私人汽车拥有量的年均增长率控制在4.0%和5.0%、3.5%和4.0%、2.0%和 3.0%、0.5%和 0.4%、1.5%和2.0%、7.5%和 7.0%。关键词:碳达峰;Lasso 回
4、归;BP 神经网络;路径研究;碳排放预测A STUDY ON CABON PEAKING PATHS IN HENAN,CHINA BASED ON LASSOEGESSION-BP NEUAL NETWOK MODELZHAO Jinhui,LI Jingshun*,WANG Panle,HOU Gaojie(School of Mechanical and Power Engineering,Zhengzhou University,Zhengzhou 450001,China)Abstract:To explore the path to carbon emission peaking
5、of Henan,China and meet the strategic need of the localauthorities,in this paper,the data of twelve factors of social,economic,energy consumption,and resources in Henan from2001 to 2020 were selected,and the Lasso-BP neural network method was used to establish a prediction model of carbonemission in
6、 Henan province Based on the regression analysis of the data of the 12 indexes,six different development pathswere designed to predict the carbon emission of Henan from 2021 to 2035 The results showed that:1)among the twelvefactors,six key factors affecting carbon peaking were the share of coal cons
7、umption,energy consumption per unit of GDP,forest coverage,total energy consumption,the share of secondary industry GDP,and private car ownership;2)paths 1 to 4pursuing single-factor development were all unable to achieve carbon peaking in 2030 Under paths 5 and 6,Henan wouldreach peak carbon in 202
8、9 Compared with path 5,the peak CO2emission of path 6 was 2.53 Mt lower,with a peak of 510.91Mt CO2;3)to achieve the carbon emission peak,the average annual growth rates of coal consumption,energy consumptionper unit of GDP,forest coverage,total energy consumption,the share of secondary industry in
9、GDP,and private carownership should be controlled at 4.0%and 5.0%,3.5%and 4.0%,2.0%and 3.0%,0.5%and 0.4%,1.5%and 2.0%,7.5%and 7.0%,during the 14th Five-Year Plan and the 15th Five-Year Plan Period respectivelyKeywords:carbon peak;Lasso regression;BP neural network;pathway study;carbon emission predi
10、ction环境工程第 40 卷0引言为应对气候危机,2020 年 9 月,习近平总书记宣布中国将争取在 2030 年前实现碳达峰,2060 年前实现碳中和1。在碳排放及碳达峰预测研究领域,国外学者的研究主要集中于碳排放对气候的影响。Margarete 等2 探讨了化石燃料燃烧、水泥生产以及土地利用变化排放等引起的碳排放对气候变化的可能影响,得到碳排放对化石燃料排放和土地利用变化排放的温度均有显著的正向影响。国内学者主要对我国进行分区域、分行业、分部门的碳排放预测研究。渠慎宁等3 利用 STIPAT 模型对未来我国碳排放峰值进行相关预测,得出技术对峰值的影响较为重要,若经济社会发展速度较高,而碳
11、排放强度下降速度相对较低,则不能在 2050 年内出现峰值,若碳排放强度降低速度相比经济社会发展速度过快,则会推动排放提早达到峰值。陆玉玲4 采用多元线性回归、Hlot-Winters 非季节指数平滑、AIMA 模型 3 种单项预测模型对我国碳排放量进行预测,得出未来 5 年,我国碳排放量处于上升趋势,而碳排放强度呈下降趋势。徐夏楠等5 采用系统动力学软件建立河南省工业领域碳排放模型,提出调节该领域碳排放量的政策。张志高等6 对河南省农业的经济与碳排放进行研究,表明河南省农业碳排放总量与经济呈倒“U”形关系,同时建立灰色模型,对农业的碳排放进行预测并提出对应减碳具体措施。孙晓林等7 剖析河南省
12、资源环境领域面临的战略机遇,得出碳中和愿景下河南省资源环境保护将面临自然禀赋差、能源结构偏煤等挑战。以往研究主要存在以下问题:1)在构建模型时,往往仅采用某一行业或某一领域的数据,研究范围较小,未考虑各行业、各领域内重要指标对碳排放的耦合作用;2)缺乏研究范围内各指标间的相互对比分析,不能凸显出某一因素对碳排放量的影响程度;3)现有研究在碳排放量数据的预测环节上多采用一个固定的增长率来预测,缺乏对现实情况的考量;4)现有碳排放预测影响因素的选取多集中在经济、能耗 2 方面,较少考虑当地碳汇的影响。河南省作为传统的农业和人口大省,同时也是能源消费大省,能源消费总量长期保持在全国第 5,其以煤炭为
13、主的能源结构以及高耗能产业占比过大,导致河南省碳排量居高不下。因此,识别河南省内碳排放的主要影响因素,并针对所筛选因素探究合理的碳达峰路径,对河南省早日实现碳达峰和碳中和的目标具有重要的借鉴与指导意义。鉴于此,本文在已有研究基础上,从社会、经济、能耗、资源 4 个维度统计河南省 20012020 年能源消费总量、第二产业 GDP 比重、森林覆盖率等 12 个指标数据作为研究河南省碳排放量的原始数据,并基于 Lasso 模型,筛选出影响碳排放量的关键因素,采用 BP 神经网络模型,建立碳排放量预测模型。依据选取出的因素,设计不同的碳达峰路径,进行碳排放的耦合预测,探索最优路径,旨在为早日实现河南
14、省碳达峰碳中和提供参考。1数学模型1.1Lasso 回归模型Lasso 回归模型是一种压缩估计,通过构造惩罚函数得到 1 个较为精炼的模型,压缩一些回归系数,同时设定一些回归系数为 0,因此保留子集收缩的优点,并且 Lasso 模型本身还可以处理数据的多重共线性问题8。Lasso 模型原理:设 x 为自变量,y 为因变量,n 次取样后得到观测数据的标准化值为(x,y),其中 x 为np 矩阵(np),y 为 n1 矩阵,第 i 个观测值为 xi=(xi1,xi2,xip)T,i 1,2,n,且各观测值相互独立,y=(y1,y2,yn)T。y 对 x 的回归模型表示为:yi=+jxij+i(1)
15、式中:i N(0,2),定义中 =y,标准化的数据中y=0,故式(1)整理后可得:y=x+(2)式中:N(0,2);为 n 维参数向量;为随机扰动项。若要筛选出影响显著的变量,则需要在式(2)加上 1 个约束条件,表达如式(3)所示。argmin 1,2,ny x2stj|0j s(3)式中:s=t0j,s 的取值范围为 0,1;t 是 1 个调和参数,t 0,Lasso 回归是通过不断调整 t 值,降低模型整体回归系数,不断压缩不显著变量的系数,直至为 0。1.2BP 神经网络模型在应用神经网络的过程中,处理信息的单元一般分为 3 类:输入单元、输出单元和隐藏单元。BP 神经网络模型的主要思
16、想如图 1 所示:向输入层中输入学习样本,通过误差反向传播对网络的偏差进行多次调251第 12 期赵金辉,等:基于 Lasso-BP 神经网络模型的河南省碳达峰路径研究整和训练,使输出值和期望值的误差尽可能小。图 1BP 神经网络的结构Figure 1Structure diagram of a BP neural networkBP 神经网络模型的原理9 为:令 X=(X1,X2,X3,Xr,Xn)为训练集,训练样本描述:输入值Xr=(Xr0,Xr1,Xr2,Xrq),真实值 yr=(yr1,yr2,yr3,yr0),预测值 sr=(sr1,sr2,sr3,sr0)。假设输入层与输出层的阈值和权重分别为 voj和 vij,隐藏层与输出层的阈值和权重分别为 uok和 ujk,预期精度为 b,迭代次数为 m。则数学表达式见式(4)(5):zj=f(Ij)=f(qi=0vijxri)(4)sk=f(Ik)=f(pi=0ujkzrj)(5)式中:Ij为隐藏层的输入;Ik为输出层的输入;zj为隐藏层输出;sk为输出层的输出;f 为传递函数。误差能量之和 E(m)为:E(m)=12ok=1 yr