1、2023.4电脑编程技巧与维护1概述1.1二手车发展现状随着经济的不断发展,人们的消费观念也在发生变化,二手车被越来越多的消费者接受。国内的二手车市场正在经历一个黄金时代,有着巨大的增长潜力,未来需要升级供应链信息系统、智能定价系统,优化运营效率和控制成本,进一步释放二手车的消费潜力。1.2二手车价格评估方法目前,二手车价格评估常用的方法有4种即重置成本法、收益现值法、当前市场价格法和清算法。这些传统的价格评估方法在不同的场合为价格评估提供了较好的思路与依据,随着市场不断发展和壮大,这些方法也需要相应的更新、调整。现在的二手车市场覆盖范围广,不同地区的二手车市场发展状况也各不相同。另外,随着互
2、联网的发展,越来越多的二手车交易由线下转换成线上购买模式,一些二手车互联网交易平台应运而生。因此,亟需一个科学评估价格、适用范围广、效率高并且人力成本低的自动估价模型,实现互联网交易系统的量化评估。1.3二手车评估与决策系统研究现状目前,国内外学者对二手车价格评价方法的研究主要分为两类:(1)改进传统的4种二手车价格评价方法;(2)利用BP神经网络、随机森林等机器学习方法,或线性回归、非线性回归等对二手车数据进行研究。屠卫星认为,对于成熟的二手车市场,目前的市场价格方法使用简单。然而,由于一些国家或地区的二手车市场不成熟,目前的市场价格方法在不同地区二手车评估中的适用性仍有待验证1。Peeru
3、n收集了来自不同来源的200辆二手车的数据,并将这些数据作为4种不同车型及其学习算法的训练数据。通过比较,他发现使用支持向量机的预测效果优于使用神经网络和线性回归,郭俊利基于改进的重置成本方法设计了二手车价格评估系统。系统包括系统管理模块、二手车参数管理模块、二手车评价管理模块、评价信息查询模块、输入相关二手车基本参数信息、计算二手车折旧率、评估采购价格、评价销售价格5。张远森通过分析专业二手车网站和中国汽车数据资源中心的二手车交易数据,建立BP神经网络模型,预测二手车价格。与BP神经网络模型和多元回归模型的预测效果相比,它反映了BP神经网络模型在二手车价格评价中的优势6。陈君通过收集某二手车
4、交易系统数据库中20162018年的数据,利用FP-Growth算法对二手车交易系统数据库中的车辆品牌、使用年限、车载人数、行驶里程、车辆价格、保养状况等信息进行整理、转换、对比、分析,从中发现二手车交易中的规律,挖掘用户购车和卖车的有关规律,提高了车辆的成交率9。龙良洲通过对二手车价格影响因素进行分析,从微观因素出发选取了二手车的18个特征建立BP神经网络模型,该神经网络模型能够根据每辆车的特征值评估二手车价格10。卢鑫海等利用区块链去中心化、可溯源、数据不可篡改的特点,并结合Hyperledger基金项目:2021年广东省高等教育教学改革项目:新工科背景下民办高校软件工程专业建设探索与实践
5、(644);广东理工学院一流课程项目:软件工程及应用(YLKC202107)。作者简介:林显宁(1982),男,博士,副教授,研究方向为机器学习算法、软件工程。二手车价格智能评估和销售决策支持系统研究林显宁(广东理工学院信息技术学院,广东 肇庆526100)摘要:随着二手车行业的发展,企业在二手车销售管理中会遇到估值困难、不科学、过度依赖劳动力等问题,对企业利润产生了较大影响。分析了二手车行业的发展现状、主要的二手车评价方法、国内外二手车价格评价的研究现状和发展趋势。在此基础上,将理论知识和开发技术相结合应用于系统的研究,结合机器学习算法、数据挖掘技术、网络技术和开发技术,将随机森林回归算法应
6、用于二手车价格评价模型,通过对模型参数的优化找到最优参数组合,进而得到价格评价模型的最优结果,设计二手车价格智能评估和销售决策支持系统。系统应用表明,基于随机森林回归算法的二手车价格智能评估和销售决策支持系统可以为二手车企业提供科学的评估价格,降低业务风险,提高销售利润。关键词:决策支持系统;二手车;随机森林算法112DOI:10.16184/prg.2023.04.0522023.4电脑编程技巧与维护Fabric架构,设计一套基于区块链的二手车交易系统。系统采用“背书排序验证”的交易流程,将信任模型与底层的共识协议解耦,加快了交易写入区块的速度。通过智能合约进行业务逻辑的实现,降低了买卖双方
7、间的信任成本,构建了安全、可靠的交易环境,加快了二手车资产的流通11。综上所述,随着二手车价格评价方法的发展,学者们在早期普遍采用重置成本法、对传统评估方法的改进、线性回归模型等方法对二手车价格进行评价。随着互联网大数据的发展,机器算法在二手车评估方面表现出越来越多的优势,学者们也开始使用机器算法进行二手车价格评估。研究表明,将机器算法应用于二手汽车价格评价系统是社会发展的需求。与传统的二手车评价系统相比,它具有更好的预测效果,为构建二手车价格智能评价和销售决策支持系统提供了更好的思路。2随机森林算法2.1随机森林算法介绍随机森林是一种常用的机器学习算法,它结合了多个决策树的输出,得到了一个单
8、一的结果。在机器学习中,随机森林是一个包含多个决策树的分类器,其输出的类别由单个树输出类别的群体数决定。对于分类问题,每个决策树对应一个分类器,因此对于一个输入样本,N棵树将有N个分类结果。随机森林整合了所有分类的投票结果,其最终输出结果产生于投票最多的类别,对于连续值问题,将输出的平均值作为最后结果。在随机森林中,弱学习者都是由分类与回归树(CART)决策树组成的,单个决策树之间没有依赖关系。随机森林算法如图1所示。从图1中可以看出,在随机森林中由多个分类树构成。样本数据准备好后,需将样本数据输入每棵树中进行分类。决策树是随机森林的基本组成元素,它们是一个直观的模型。可以将决策树视为一系列关
9、于数据是或否的问题,从而产生一个预测类别(或回归情况中的连续值)。随机森林的弱分类器使用CART决策树。当需处理的数据集是一个连续的因变量时,该树就是一个回归树,可以使用叶节点得到的平 均值作为预测值。CART决策树根据基尼系数选择特征,基尼指数公式如公式(1)所示:(1)当遍历每个特征的分割点,并且使用特征A=a时,将D分为两个部分,即D1(满足A=a的样本集)和D2(不满足A=a的样本集)。在特征A=a下,D的基尼指数可以用公式(2)表示,即对于样本D,如果根据特征A的值将样本分为D1和D2两个部分,则特征A下D的基尼系数如公式(2)所示:(2)2.2随机森林算法的优点(1)其精度优于大多
10、数单一算法,是一个集成算法。(2)在测试集上表现优异,因为引入了随机样本和随机特征,所以随机森林算法不容易陷入过拟合。(3)由于树的组合,随机森林算法可以处理非线性数据。(4)训练速度快,可应用于大规模数据集。3二手车价格智能评估与决策系统研究3.1研究思路以二手车销售企业为研究对象,构建具有智能价格评估功能的二手车销售决策支持系统。该系统将随机森林算法应用于价格评估模型,借助Python开发工具对模型参数进行优化,寻找模型的最优参数组合,进而得到二手车价格评估模型的最优结果。该系统研究的模型可以提供一种评估二手车价格的通用方法。研究选取的数据为二手车交易真实数据,用于建立二手车估值模型,通过
11、对回归预测结果的分析和使用,帮助二手车企业在销售管理过程中做出科学的决策。3.2系统设计3.2.1 概念框架系统概念框架如图2所示,主要包含数据预处理、数据建模系、统框架等过程。(1)数据预处理。系统从数据采集开始,数据主要来自二手车经销商。根据某些业务规则提取并转换数据,将处理后的数据加载到数据仓库中。对数据集中的异常样本数据进行清理。(2)数据建模。在此阶段,主要建立随机森林模型,使用Python优化学习模型的参数,并建立模型,图1随机森林算法Random Forest SimplifiedInstanceRandom ForestTree-1Tree-2Tree-nClass-AClas
12、s-BClass-BMajority-VotingFinal-Class1132023.4电脑编程技巧与维护idCaridCar_NameStyle YearSellingPricePresentPriceKmsDriven Fuel_Type Seller_Type1c1001citySedan 20135.3619.834 200.00PetrolDealer2c1002amazeSedan 20176.021431 500.00PetrolDealer3c1003ritzSedan 20164.379.7858 078.80Petrol4c1004TVS ApacheRTR 160Sed
13、an1.071.6210 620.00PetrolIndividual5c1005TVS JupyterSedan 20170.581.0417 100.00PetrolIndividual6c1006dzireSedan 20187.6714.443 890.30Petrol7c1007Bajaj Pulsar150Sedan 20181.071.484 500.00PetrolIndividual8c1008ritzSedan 20175.5311.1824 300.00PetrolDealer9c1009fortunerSUV15.2640.953 100.00PetrolDealer1
14、0 c10010i20SUV 2019 10.3115.26 300.00Diesel11 c10011Audi TTCoupe 20160.831.9840 500.00PetrolIndividual12 c10012vernaSedan 2018 13.6118.855 242.90PetrolDealer13 c10013fortunerSUV 2018 37.9561.2236 000.00DieselDealer14 c10014sx4Sedan 20063.7115.9655 800.00DieselDealer15 c10015jazzSedan9.9016.83 600.00
15、Petrol16 c10016swiftSedan 20166.8511.7449 624.20PetrolDealer17 c10017Hero HondaCBZ extremeSedan 20140.631.57467 500.00PetrolIndividual18 c10018sx4Sedan 20144.8715.4844 998.20PetrolDealer19 c10019corolla altisSedan 2016 11.4737.2236 000.90CNGDealer20 c10020Bajaj Avenger220 dtsiSedan 20180.991.914 940
16、.00PetrolIndividual21 c10021citySedan 2017 11.8819.843 200.00PetrolDealer22 c10022brioSedan 20154.9510.748 307.50DieselDealer23 c10023Bajaj Discover125Sedan 20150.331.1422 500.00PetrolIndividual24 c10024balenoSUV 20199.6515.7422 071.60PetrolDealer25 c10025fortunerSUV 2016 26.4061.22121500.00PetrolIndividual26 c10026Bajaj Avenger220Sedan 20191.191.9450.00DieselIndividual27 c10027Bajaj Avenger150 streetSedan 20190.991.618 000.00PetrolIndividual28 c10028jazzSedan 2019 12.211713 553.10PetrolDealer29