1、浙江工贸职业技术学院学报JOURNAL OF ZHEJIANG INDUSTRY&TRADE VOCATIONAL COLLEGE第22卷第4期2022年12月Vol.22 No.4Dec.2022基于神经网络模型的空气质量监测数据校准方法研究*朱微微(浙江工贸职业技术学院,浙江 温州 325003)摘 要:为了对微型空气质量检测仪所检测的数据(包括PM2.5等)进行校准,以国家环境空气质量自动监测站准确数据为输出变量,以检测数据为输入变量,分别建立了BP神经网络模型和RBF神经网络模型,通过比较发现:BP神经网络模型不但能够对检测数据校准,而且校准后的数据误差非常小。关键词:BP神经网络;R
2、BF神经网络;空气质量;数据校准中图分类号:X831文献标志码:A文章编号:1672-0105(2022)04-0059-04Research on Calibration Method ofAir Quality Monitoring Data Based on Neural Network ModelZHU Weiwei(Zhejiang Industry&Trade Vocational College,Wenzhou 325003,China)Abstract:In order to calibrate the data(including PM2.5,etc.)detected by
3、 the miniature air quality detector,BP neural networkmodel and RBF neural network model were established respectively with the accurate data of National Ambient Air Quality AutomaticMonitoring Station as the output variable and the detection data as the input variable.Through comparison,it is found
4、that BP neuralnetwork model can not only calibrate the detected data,but also the data error after calibration is very small.Key Words:BP neural network;RBF neural network;air quality;calibration of data收稿日期:2022-08-29基金项目:浙江省教育厅一般科研项目“智慧环保背景下微型空气质量检测仪监测数据校准模型”(浙教办函2020108号)作者简介:朱微微(1990),女,浙江永嘉人,硕士
5、,助教,主要研究方向:应用数学和高职教育。0 引言国家环境空气质量自动监测站(简称国站)的采样仪器能够自动、有效地对空气进行采样,各单位检测出的数据基于同一标准且数据结果可追溯到同一源头,使得监测结果准确、可信。由于国站布控较少,检测用时长、数据发布存在时间滞后较长,以及花费较大等问题,无法满足对实时空气质量的监测和预报。微型空气质量检测仪(简称企站)可以弥补上述不足,能够实现网格化监控。国站对可吸入颗粒物和大气环境进行监测,主要包括PM2.5与PM10两种颗粒物和CO、NO2、SO2及O3四种气体(简称“两颗四气”)。企站除监测“两颗四气”,同时还可监测温度、湿度、风速、气压、降水等气象参数
6、。目前,微型空气质量检测仪尚存在精度不高这一不足。如何提高微型空气质量检测仪的检测精度成为迫切需要解决的问题。本文以国站发布的数据为比较对象,建立数据校准模型,对微型空气质量检测仪所检测的数据(包括PM2.5等)进行校准,并通过误差分析对模型的精度进行检验。第一部分为神经网络模型介绍;第二部分是神经网络模型的建立及其误差分析;第三部分介绍应用BP神经网络模型实现空气质量数据校准的方法。1 神经网络模型介绍人工神经网络是模拟生物神经网络进行信息处理的一种数学模型,目前已研究出近40种人工神经网络模型。4本文仅使用BP神经网络和RBF神经网络来研究空气质量数据的校准方法问题。1.1 BP神经网络B
7、P神经网络是一种三层或三层以上的多层神Doi:10.3969/j.issn.1672-0105.2022.04.012浙江工贸职业技术学院学报2022年12月经网络,其中包含一个输入层、一个或多个隐含层以及一个输出层,它采用“误差逆传播算法”对误差进行修正,从而不断降低模拟误差。5,6BP算法的学习过程由信号的正向传播和误差的反向传播两个过程组成。正向传播时,把样本的特征从输入层输入,信号经各个隐含层的处理后,从输出层传出。对于网络的实际输出与期望输出之间的误差,把误差信号从最后一层逐层反传,从而获得各个层的误差学习信号,再据此修正各层神经元的权值。所以我们在使用BP算法的时候,第一步根据网络
8、预测的误差计算最后一层的学习信号,第二步计算倒数第二层的学习信号,第三步计算倒数第三层的学习信号,以此类推,从后向前计算,这也是BP算法名称的由来。计算得到每一层的学习信号后,计算每一层的权值矩阵如何调整,最后对所有层的权值矩阵进行更新。71.2 RBF神经网络径向基函数(Radial Basis Function,RBF)神经网络最早是由Moody和Darken于1988年提出的。该神经网络的非线性拟合能力非常强,学习规则也简单,具有很强的函数逼近能力、分类能力和学习速度,因而得到了广泛的应用。8,9RBF神经网络是由输入层、隐含层、输出层组成的三层前馈式网络,输入层到隐含层通过非线性映射连
9、接,隐含层到输出层通过线性映射连接。2 基于神经网络模型的空气质量数据校准模型建模思路:(1)把企站分钟级数据转化为小时级数据,与国站数据一一对应起来,作为输入数据为下一步建模做好准备。(2)建立神经网络模型,以企站11个因素(6个空气质量因素,及5个气象因素)作为输入层的11维输入变量,以国站的某个空气质量数据作为输出层的一维输出变量。(3)采集第t日之前的n日数据作为建模数据。(4)从建模数据中留下最后1个数据作误差检验,其余数据作网络训练。(5)采用“等维逐日新陈代谢”思想,即使用第t日之前的n日数据作网络训练和误差检验,再对第t日的数据进行校准并发布,接着,使用第t+1日之前的n日数据
10、作网络训练和误差检验,再对第t+1日的数据进行校准并发布,以此类推。(6)误差检验指标为相对误差绝对值。2.1 数据整理企站的数据是分钟级数据(不足5分钟发布一次),而国站数据是小时级数据。为了对企站数据进行校准,就需要以国站数据为参考标准,于是必须将企站的分钟级数据转化为小时级数据。2.2 误差评估设y0为国站发布的某指标空气质量数据,y1为企站发布的该指标的空气质量数据,y2为企站发布的该指标的空气质量数据的校准值,则校准前企站该指标的相对误差绝对值为1=|y1-y0y0(3)校准后企站该指标的相对误差绝对值为2=|y2-y0y0(4)2.3 模型建立与求解由于最旧的数据对未来的预测价值最
11、小,相反,最新的数据对未来的预测价值最大,于是从历史数据中仅仅截取最近几天的小时级数据用于建模。在建模时,从全部建模数据中留下最后1个数据作误差检验,其余数据用于网络训练。2.3.1 BP神经网络模型的建立与求解以PM2.5为例。BP神经网络算法如下:图1 三层的BP神经网络模型图2 RNF神经网络模型60第22卷 第4期第1步,令滞后天数最大值T=30;滞后天数i=1。第2步,将过去i天的国站PM2.5指标作为输出变量,将对应的企站6个空气质量指标和5个气象指标作为输入变量。数据总数n=24i。留下最后1个数据作为检验数据,其余的n-1个数据作为训练数据。计算校准前企站PM2.5的相对误差绝
12、对值1。第3步,令相对误差绝对值=+;隐含层的神经元个数最大值M=20;令隐含层的神经元个数j=1。第4步,训练BP数据网络,并输出隐含层的神经元个数j、校准后的PM2.5数据y2、校准后企站PM2.5的相对误差绝对值2。第5步,如果2,则=2。第 6 步,j=j+1。如果jM,则返回第 4步,否则执行第7步。第7步,i=i+1。如果iT,则返回第2步,否则执行第8步。第8步,从滞后天数i=1,2,.,T中,选择相对误差绝对值2最小的那一天,以及对应的隐含层的神经元个数j、校准后的PM2.5数据y2,结束。BP神经网络模型的计算结果如表1所示。从表1可知,与校准前相比,校准后的数据误差有大幅度
13、的降低。2.3.2 RBF神经网络模型的建立与求解仍然以PM2.5为例。RBF神经网络算法如下:第1步,令滞后天数最大值T=30;滞后天数i=1。第2步,将过去i天的国站PM2.5指标作为输出变量,将对应的企站6个空气质量指标和5个气象指标作为输入变量。数据总数n=24i。留下最后1个数据作为检验数据,其余的n-1个数据作为训练数据。计算校准前企站PM2.5的相对误差绝对值1。第3步,训练RBF数据网络,并输出校准后的表1 BP神经网络模型的计算结果指标PM2.5PM10CONO2SO2O3滞后天数231619242024隐含层的神经元个数9201521819校准值32.003661.2523
14、1.009817.016515.9995220.0180校准后误差0.00010.00410.00020.00100.00000.0001校准前误差0.00900.23520.10810.51560.03500.2947开始T=30,i=1计算1M=20,=+,j=1j=j+1jM选择最小的2对应的i,j,y2结束是训练BP网络,输出j,y2,22?否i=i+1iT?是否=2是否图3 BP神经网络算法流程图开始T=30,i=1计算1训练RBF网络,输出y2,2i=i+1iT?选择最小的2对应的i,y2结束否是图4 RBF神经网络流程图朱微微:基于神经网络模型的空气质量监测数据校准方法研究61浙
15、江工贸职业技术学院学报2022年12月PM2.5数据y2、校准后企站PM2.5的相对误差绝对值2。第4步,i=i+1。如果iT,则返回第2步,否则执行第5步。第5步,从滞后天数i=1,2,.,T中,选择相对误差绝对值2最小的那一天,以及对应的校准后的PM2.5数据y2,结束。RBF神经网络模型的计算结果如表2所示。从表 2 可知,RBF 神经网络模型在 PM10、CO、NO2、O3上的校准是有效的,而在PM2.5、SO2上的校准是无效的。3 空气质量监测数据校准与发布方法从表1和表2可知,BP神经网络模型针对空气质量监测指标 PM2.5、PM10、CO、NO2、SO2、O3的数据校准都是有效的
16、,而RBF神经网络模型只有在PM10、CO、NO2、O3上的校准是有效的,所以相比之下,BP 神经网络优于 RBF 神经网络。因此,在实际数据校准中,选择BP神经网络模型,并选用表1的参数。以空气质量指标PM2.5的数据校准为例,使用BP神经网络模型进行校准并发布的方法如下:第1步,采集国站PM2.5第t-22至第t日(共23天)的小时级数据。第 2 步,采 集 企 站 空 气 质 量 指 标 PM2.5、PM10、CO、NO2、SO2、O3以及气象指标温度、湿度、风速、气压、降水的第t-22至第t日(共23天)的分钟级数据,并使用Shepard方法把分钟级数据整合成小时级数据。第3步,建立BP神经网络模型,隐含层的神经元个数取9,把国站PM2.5指标小时级数据作为输出变量,把企站6个空气质量指标和5个气象指标的小时级数据作为输入变量,使用23天的数据训练网络。第4步,把企站PM2.5指标第t+1日的分钟级数据代入训练好的BP神经网络进行校准,获得校准值,然后发布,结束。综上,本文得出结论:BP神经网络模型不但能够对6个空气质量指标进行校准,而且校准后的数据误差非常小。在此基础上给出了