1、技术74强化污染源在线监控数据运用的思考文_秦俊杰 长治市生态环境局潞州分局摘要:污染防控工作能够将污染问题进行前置化处理,在污染发生前进行管控,减少污染治理的难度,提升整体环保质量,但传统的污染防控受数据冗余的影响,常会出现数据利用率不足、防控延迟、防控功能单一的问题。本文将大数据技术与污染源在线监控进行结合,首先进行在线监控数据有效性分析,再以山东省青岛市某工业区的重点监控企业为研究对象,构建污染源在线监控数据有效性强化模型,最后通过废气、废水排口在线监控该数据有效性指数验证文章方法的有效性。关键词:污染源;在线监控;大数据技术Thoughts on Strengthening the A
2、pplication of Online Monitoring Data of Pollution SourcesQIN Jun-jie Abstract Pollution prevention and control work can pre-process pollution problems,control pollution before it occurs,reduce the difficulty of pollution control,and improve the overall environmental protection quality.However,tradit
3、ional pollution prevention and control is affected by data redundancy,which often leads to problems such as insufficient data utilization,delayed prevention and control,and single prevention and control function.Based on this,the article combines big data technology with online monitoring of polluti
4、on sources.First,it analyzes the effectiveness of online monitoring data,and takes a key monitoring enterprise in an industrial zone in Qingdao,Shandong Province as the research object to build an enhanced model for the effectiveness of online monitoring data of pollution sources.Finally,it verifies
5、 the effectiveness of the articles method through the effectiveness index of online monitoring data of exhaust gas and waste water outlets.Key words pollution source;online monitoring;big data technology使用统一的智能污染源监控网络,将主要污染源进行监控,并通过视污染源在线监控,实现对企业现场的远程控制,及时发现弄虚作假的行为、留存相关证据,将污染源企业的操作进行透明化监控,还可以通过该监控网络
6、,实现对污染源排放过程监控从“点末端监控”向“全过程监控”扩展,形成对相关污染源企业排放的“立体化”监控手段,全面提升对污染源的监控精细化、实时性程度。1 污染源在线监控数据有效性分析为提升污染源在线监控的力度,国家出台了一系列监控标准和规范文件,为污染源在线监控工作提出具体的应用规范和指导方法,地方政府也积极响应号召。辽宁、山东等地采取动态管控,以确保污染源自动监控数据真实、准确;深圳利用动态跟踪系统对在线监控数据进行有效性审核;内蒙古自治区、江苏省通过建设工况监控系统进一步保障在线监控数据的有效性、真实性。上述政策和指导方案仅是从管理层面出发的方法,具体污染源在线监控情况与污染源企业的生产
7、运营状态息息相关,需要工作人员定期到污染源企业进行实地检测,再将在线监控数据和实地检测数据进行对比分析,以此判断长期的污染控制情况,受多方因素的影响,实地检测的频次和方法较为固定,可能会被污染源企业利用,进行弄虚作假。基于此现象,将大数据技术和污染源在线监控数据展开结合,能够实现在线监控数据的异常值监控、实时数据传输、固定时段数据分析等功能,进而提升污染源在线监控数据的有效性。2 构建污染源在线监控数据有效性强化模型山东省青岛市某工业区包括 8 个废气排放企业和 7 个废水排放企业,文中以该工业区中的 15 个污染源企业为研究对象,对污染源企业运行数据、排口数据、废气排放在线监控数据、废水排放
8、在线监控数据进行分析,并构建污染源在线监控数据有效性强化模型。2.1 数据预处理根据污染源在线监控数据的数据类型,选择使用探索性数据分析来分析和调查数据集并总结其主要特征。数据分析后发现,污染源在线监控数据在同一时间轴中,常会出现间歇性数据丢失、数据峰值化等现象,其原因可能是设备故障、网络波动、传感器异常值等情况,这种间歇性数据波动会破坏数据的连续性,在建模时会出现缺失值和异常值。基于此,采用缺失值插补算法进行处理,缺失值插补算法分为前向递补(最近有效值递补缺失值)和均值替代(同一个中间轴的平均值替代缺失值)两种方法,其中前向递补的处理见公式(1)、均值替代的处理见公式(2)。()xm xmx
9、1tdtdtdtdtd=+-(1)()xm xmx1tdtdtdtdd=+-?(2)式中 ()xm xmx1tdtdtdtdtd=+-缺失值;()xm xmx1tdtdtdtdtd=+-相邻有效值;()xm xmx1tdtdtdtdd=+-?-均值。752.2 构建数据有效性评估模型数据有效性评估模型主要包括异常检测和有效性智能评估功能模块。通过将污染源基本信息和废气、废水在线监控等数据输入到异常检测模块中,对样本进行分类(正常样本和异常样本);异常检测模型的结果作为有效性评估模型的输入,对企业在线监控数据有效性进行分析建模,构建有效性智能评估模块,对不同粒度(污染源排口粒度,企业粒度)的数据
10、进行有效性评估。2.2.1 基于K-Sigma的异常值检测基于 K-Sigma 的异常值检测方法是基于数据分布的一种异常值检测方法。能够根据污染源在线监控数据的分布形式和原始数据计算出分布参数,再将分布参数代入分布方程求解异常值概率。通常情况下,分布形式分为正态分布和泊松分布两种,原始数据分为正常数据(集中点)和离散数据(离群点)两种。2.2.2 建设有效性智能评估模块2.2.2.1 时间窗口确定污染源在线监控对污染排放口的监控是持续性的,时间窗口呈轴线状发展,由此可以将当前时间设为T,再向前追溯N个时间点,得到时间分析窗口T-N。通常情况下,时间窗口为污染源企业的污染排放时间,如研究区内的废
11、气排放企业 3,每天14:00 15:00 为废气排放时间,因此模型的时间窗口必须包括该时段。2.2.2.2 异常概率建模通过对时间窗口内的正常样本和异常样本进行分析,得到每个污染物排口每种污染物的异常概率,异常概率建模见公式(3)。Pmnn=+(3)式中 P-污染物异常概率;n-异常样本数;m-正常样本数。根据实践证明,时间对污染物异常概率具有较大的影响,文中在异常概率计算中引入时间衰减因子,进而按公式(4)、公式(5)计算出考虑时间因素的异常概率。()expTt1t=-(4)pjmtjntint111j11=+=(5)式中 ()expTt1t=-时间衰减因子;-时间量;pjmtjntint
12、111j11=+=-考虑时间衰减的异常概率。2.2.2.3 有效性指数建模根据考虑时间衰减的异常概率可以计算出每个污染企业的污染物异常排放概率,以此建立有效性指数分析模型,得到企业粒度的异常概率,进一步得到有效指数,具体计算见公式(6)。,(,),yfxinxx xxin1 21 2iiiiiimTmT1212=()(6)2.3 结果输出基于异常检测和有效性智能评估模型,对研究对象的在线监控数据进行建模分析,通过模型算法,输出最终结果。表1是部分废气排口在线监控数据有效性指数;表 2 是部分废水排口在线监控数据有效性指数。表1废气排放口在线监控数据有效性指数企业名称废气排放口有效指数12138
13、45700013_50.87802213845700045_140.86163213845700045_140.85954213845700022_190.85665213845700021_30.85426213845700017_120.85237213845700017_200.84818213845700019_230.8423表2 废水排放口在线监控数据有效性指数企业名称废水排放口有效指数A213845700041_10.8573B213845700042_230.8487C213845700056_40.8391D213845700057_20.8356E213845700031_
14、80.8250F213845700032_10.8149G213845700020_10.8037根据表1 和表 2 可以得知,通过污染源在线监控数据有效性强化模型对污染源在线监控数据进行强化后,对污染源的监控数据有效指数均提升到 0.8 以上,部分公司的有效指数超过 0.85,充分验证了文章方法的有效性。3 结语本文将大数据技术与污染源在线监控进行结合,以山东省青岛市某工业区的重点监控企业为研究对象,构建污染源在线监控数据有效性强化模型,充分验证了文中方法的有效性。今后可以在实践中充分发挥大数据技术的学习优势,进一步释放数据有效性强化模型的作用,为我国污染防控工作提供新思路。参考文献1 钟廷勇,黄亦博,孙芳城.“重点污染源监控”的节能减排效应研究兼析优化环境分权治理的信息沟通路径 J.西部论坛,2022,32(03):81-97.2 夏淼奇,孙斌,徐胜龙.试论污染源自动监控管理工作的持续推进措施 J.皮革制作与环保科技,2022,3(06):46-48.3 牛轶群.水污染源自动监控系统运行存在的问题及对策 J.黑龙江环境通报,2022,35(01):76-77+80.作者简介秦俊杰(1981-),男,汉,山西长治人,本科,研究方向为污染源在线监控技术应用与发展。