1、第 43卷第1期辽宁工业大学学报(自然科学版)Vol.43,No.12023 年 2 月Journal of Liaoning University of Technology(Natural Science Edition)Feb.2023收稿日期:2022-06-22基金项目:安徽财经大学研究生创新项目(ACYC2021433);安徽财经大学研究生教学研究课题(cxjhjyzda1803);安徽省教育厅教研课题(2020jyxm0037,2020zyrc02,2020mooc005)作者简介:熊琳(1999-),女,湖北随州人,硕士生。陈涛(1972-),男,安徽太和人,副教授,硕士。DO
2、I:10.15916/j.issn1674-3261.2023.01.014基于 PSO-SVM 的安徽省城市生活垃圾清运量预测模型研究熊琳,陈涛(安徽财经大学 管理科学与工程学院,安徽 蚌埠233030)摘要:城市生活垃圾清运量的可靠预测是垃圾精准管理的前提条件。首先通过主成分分析和相关性分析,确定了影响城市生活垃圾清运量的主要因素,在传统支持向量机(SVM)的基础上,引入粒子群算法(PSO)对 SVM参数进行优化,构建了基于 PSO-SVM 的城市生活垃圾清运量预测模型,并对模型进行了评价分析。最后对安徽省城市生活垃圾数据为基础,确定了影响垃圾清运量的 5 个主导指标,运用 PSO-SVM
3、 模型对清运量进行预测,结果表明,该模型比传统的线性回归模型预测精度更高,误差更小,适应性更强。关键词:粒子群算法;支持向量回归;城市生活垃圾清运量;机器学习中图分类号:TP18文献标识码:A文章编号:1674-3261(2023)01-0064-07Research on the Prediction Model of Municipal Solid Waste Collectionand Transportation Volume in Anhui Province based on PSO-SVMXIONG Lin,CHEN Tao(School of Management Scienc
4、e and Engineering,Anhui University of Finance&Economics,Bengbu 233030,China)Abstract:The reliable prediction of the amount of municipal solid waste(MSW)collection andtransportation is a prerequisite for accurate waste management.Firstly,through principal componentanalysis and correlation analysis,th
5、e main factors affecting the amount of MSW collection andtransportation are determined.On the basis of traditional support vector machine(SVM),particle swarmoptimization(PSO)algorithm is introduced to optimize the parameters of SVM,and a prediction modelfor the amount of MSW collection and transport
6、ation based on PSO-SVM is constructed,and the modelis evaluated and analyzed.Finally,based on the data of urban domestic waste in Anhui Province,fiveleading indicators that affect the amount of MSW collection and transportation are determined,and theamount of MSW collection and transportation is pre
7、dicted.The results show that the model has higherprediction accuracy,smaller error and stronger adaptability than the traditional linear regression model.Key words:particle swarm algorithm;support vector regression;MSW collection andtransportation volume;machine learning党的十九大报告明确提出,要建立资源节约与环境友好的绿色发展
8、体系。生活垃圾被叫做“被放错地方的资源”,对其进行有效管理,可以节约土地资源、减少各种环境污染、有利于资源再生、有益人类的健康。城市垃圾作为一种资源被开发利用是未来的一大发展趋势。第 1 期熊琳等:基于 PSO-SVM 的安徽省城市生活垃圾清运量预测模型研究65实现城市生活垃圾的高效管理和利用,就必须要合理准确预测其清运量。由于城市生活垃圾的产生量受到许多不确定性因素的影响,导致准确的城市生活垃圾清运量预测困难且具有挑战性。根据现有的文献来看,我国关于城市生活垃圾的研究侧重于垃圾处理措施、设备和技术等方面,对垃圾产生量的研究相对较少。学者们主要通过传统建模方法对其进行预测,如回归模型、灰色预测
9、、时间序列等。这些方法具有原理简单,容易操作等优点,但是由于数据量少,数据存在噪音,因此传统方法在预测效果上还有待进一步提高。1相关工作城市生活垃圾清运量影响因素及预测,通常使用地理、人口和社会经济数据来估计未来的废物产生。也有一些学者运用多元回归模型、灰色预测模型、神经网络预测等方法进行预测。灰色预测模型(gray forecast model)是一种可以利用少量、不完全的信息,通过建立数学模型进行预测的工具,尤其是在解决小样本预测问题上具有优势。任丽萍等1,熊华平等2及何宗健等3学者采用灰色预测模型,根据历年的生活垃圾清运量数据进行预测;仝延增等4使用灰色分数阶 FGM(1,1)模型建模;
10、Islam 等5利用灰色理论来预测庭院垃圾的产生;传统的预测方法中,最典型的就是回归分析,回归分析法因其理论成熟、算法简单而被广泛应用于城市生活垃圾产生量预测。葛莉等6建立基于时间序列的一元回归的垃圾清运量预测模型;由于垃圾清运量影响因素有很多,使用单一变量进行预测,预测结果不稳定且精度较低,更多学者采用度多元线性回归的方法进行预测。吕洪涛7分析了6 项影响城市生活垃圾清运量的主要因素,并利用灰色模型和多元线性回归对其进行了预测;Zhang等8建立了岭回归和 GM(1,N)的混合模型来预测城市生活垃圾清运量;Ghinea 等9应用废物预测工具、回归分析和时间序列分析来预测城市固体废物的产生和组
11、成,构建了 6 种固体废物部分的回归方程;曾藏等10采用最小二乘法预测城市生活垃圾清运量,并指出人口数、建成区面积及地方生产总值与城市生活垃圾产生量有较高的相关性;然而,当使用不完整的数据时,回归预测的准确性不令人满意,并且回归分析不能将影响城市生活垃圾产生的所有因素用于研究因变量和自变量之间的关系。相对于前面的传统预测模型,越来越多的学者使用机器学习预测模型,主要原因是它们具有高精度和获取新的复杂数据并深入挖掘信息的能力。一些学者使用机器学习的方法研究城市生活垃圾清运量,其预测结果比使用回归模型和灰色模型更加准确。于涛等11、夏晶等12、郑文13通过构建 BP神经网络模型进行预测;汤鸣14建
12、立 3 层 BP 神经网络模型预测西安市生活垃圾产量;Coskuner 等15应用多层感知器人工神经网络(MLP-ANN)来验证垃圾填埋场废物年产生率的预测;虽然神经网络具有很强的自适应能力和泛化能力,但是该算法容易陷入局部极值问题,且收敛速度慢。为了改善神经网络的不足,通常需要对神经网络的参数进行优化。Vu 等16研究了 4 种模型参数优化方法,并将其输入循环神经网络模型;Rosecky 等17利用主成分分析了影响城市垃圾产生的各种因素,构建多变量线性回归、广义线性模型以及基于树的机器学习预测模型(回归树、随机森林、梯度提升回归树);Nguyen 等18比较 6 种基于机器学习(ML)的模型
13、,预测越南选定住宅区的城市固体废物(MSW)产生;Adeleke 等19研究了模糊 c 均值(FCM)、网格分区(GP)和减法聚类(SC)对 ANFIS 模型性能的影响;然而采用神经网络的方法进行预测,需要大量的历史数据,并且存在“过度学习”等问题。机器学习方法中,除了神经网络应用广泛外,支持向量机因其能够很好的解决小样本、“贫”信息问题,受到大量学者欢迎。Chapman-Wardy 等20使用了贝叶斯正则化等方法,对人工神经网络模型的参数进行优化,构建模型预测平均每月垃圾产生量;Dunkel 等21使用了机器学习数据回归(支持向量、梯度提升和随机森林)和聚类模型(k-means)来分别预测废
14、物生产;此外,SVM 还被用于工程造价预测、能源需求预测及供应链需求预测,研究表明,基于 SVM的预测模型预测精度高,预测速度快。因此,根据对前人研究的分析和总结,且考虑到城市生活垃圾清运量所使用的数据主要是近 10年的数据,样本数据量相对较少,本文采用相比于神经网络更适合用于解决小样本问题的支持向量机进行预测。不过,支持向量机模型涉及到大量超参数,需要对这些参数进行寻优求解。目前用于各种模型超参数寻优的算法有很多,本文采用参数少、收敛快的粒子群算法进行调参。提出基于粒子群优化支持向量机的城市生活垃圾清运量预测模型,并将结果与回归分析预测结果进行比较,以期构建高精度、预测速度快的模型,为安徽省
15、城市生活垃圾管理系统的规划、设计和实施提供依据。66辽宁工业大学学报(自然科学版)第 43 卷2PSO-SVM 模型理论分析2.1SVM 基本原理对垃圾清运量进行预测,目前主要包括多元回归、灰色预测模型、神经网络等。但是,这些方法都存在一定的局限性,在预测结果的精度上还有待提高。比如,多元回归模型虽然原理简单、易理解且建模快,但是该方法对异常值非常敏感,而样本指标数据并不完全平稳;相比于线性回归模型,灰色预测模型预测准确度更高,且适用于解决历史数据较少的问题,但是它只适合近似于指数增长的预测;神经网络算法样本需求大,未能考虑到样本数量有限的情况。由 Vapnik 等学者提出来的支持向量机(SV
16、M,support vector machine)对小样本、局部极小、非线性、高维度等问题有较好的处理能力且运算速度快。相较于其他的机器学习算法,SVM不太容易出现“过拟合”,且具有较高的预测精度。即使在样本数据很少的情况下,仍然能够成功处理小样本的回归问题,并进行预测,所以本文采用SVM 对城市生活垃圾清运量进行预测。垃圾量预测属于回归问题,因此本文采用本支持向量回归机(SVR)进行预测。图 1SVM 与 SVR 原理图SVM 的主要原理:利用核函数将原始样本映射到高维空间,使低维空间中原线性不可分问题转化为高维空间的近似线性问题,然后对高维空间中近似线性问题进行求解,最后映射回原低维空间,从而实现拟合回归。其回归预测模型原理如下:给定的安徽省城市生活垃圾清运量相关数据作为训练集()()11,ttSx yx y=,xi是输入指标,yi是输出项,即垃圾清运量预测值。经过 SVR模型训练,将训练样本映射到高维空间中,其在高维空间中的最优回归函数为:()()iifxxbT=*+(1)式中:w 为权向量,()ix为非线性映射特征空间,b 为偏差。引入松弛变量ii*、和惩罚因子 C,则SVR