收藏 分享(赏)

基于DBSCAN算法的城市交通小区划分_王军.pdf

上传人:哎呦****中 文档编号:2367923 上传时间:2023-05-10 格式:PDF 页数:3 大小:1.44MB
下载 相关 举报
基于DBSCAN算法的城市交通小区划分_王军.pdf_第1页
第1页 / 共3页
基于DBSCAN算法的城市交通小区划分_王军.pdf_第2页
第2页 / 共3页
基于DBSCAN算法的城市交通小区划分_王军.pdf_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、智能规划NO.02 202380智能城市 INTELLIGENT CITY基于DBSCAN算法的城市交通小区划分王军1,2 高建杰1*(1.四川警察学院,四川 泸州 646000;2.泸州市公安局交通警察支队,四川 泸州 646000)摘要:文章介绍了DBSCAN算法的基本原理,采用Python编程的方式实现DBSCAN算法的聚类过程。以城市道路中高清智能卡口空间位置作为聚类对象,实现划分交通小区的目的。采用轮廓系数对聚类效果进行评价,结果表明,使用DBSCAN聚类算法可以快速、便捷地实现城市交通小区的划分。关键词:交通小区划分;DBSCAN;Python中图分类号:F724.6 文献标识码:

2、A 文章编号:2096-1936(2023)02-0080-03DOI:10.19301/ki.zncs.2023.02.023交通小区是宏观交通调查的基本单元。交通小区划分的目的是将一定区域内的所有交通信息整合为统一的交通数据源,实现交通数据从微观到宏观的转变,便于从宏观视角研究交通出行特征和规律。交通小区主要应用于交通规划领域,创建交通小区可有效降低交通调查和分析的复杂度,使得交通相关性分析成为可能,为交通需求和预测工作提供有力保障1。1交通小区划分方法1.1常用方法交通小区划分常用的方法包括:区域特性聚类。参考研究范围内的行政区划信息,对研究区域进行初步的细粒度交通小区划分,分析各个交通

3、小区内用地性质、经济、社会等性质,利用系统聚类选择适当的聚类指标,对初步划分的交通小区进行聚类,对空间邻近、性质相似的小区进行合并,根据交通小区划分的基本原则对划分后的结果予以修正2;基于出行比例的交通小区划分。利用交通小区划分原则中的出行占比原则,优先调整交通小区半径值R、出行距离S,计算交通小区内部出行比例,将比例结果与交通小区划分中区内出行比例进行比较,判断是否满足约束比例,若不满足,则重新调整R值,若满足,则根据小区半径R得到交通小区划分方案;基于手机话务量的聚类分析。利用土地使用性质进行交通小区划分,结合Cell-ID定位的手机定位信息得到OD矩阵,将手机基站覆盖的范围映射到初步划分

4、好的交通小区内,结合手机基站的覆盖范围和交通小区划分范围,得到最终的交通小区划分结果3;基于GPS数据聚类的交通小区划分。利用驾驶人和乘客上下车的GPS位置坐标数据,处理得到居民出行的起讫点,利用K-Means聚类算法对起讫点聚类,计算聚类后各簇的边界,从而得到划分的交通小区4。1.2DBSCAN聚类算法可行性为了快捷实现城市交通小区划分工作,考虑数据来源的可靠性、聚类算法的可操作性,文章采用DBSCAN聚类算法,对城市道路中高清智能卡口的空间地理位置进行聚类,实现交通小区划分工作。(1)数据适用性。在城市道路中,高清智能卡口的地理空间位置数据信息是研究OD矩阵的一类静态数据信息,高清智能卡口

5、对位置坐标经纬度数据信息获取方便,且非常适用于DBSCAN密度聚类。(2)原理相似性。高清智能卡口地理空间布设位置,一般布设于城市道路交叉口的进口道或城市交通干道的路段中央,通常交通越复杂、人口越稠密、交通需求越高的区域高清智能卡口的布设越密集,这与DBSCAN算法要求聚类空间的领域距离(Eps)范围内涵盖的聚类对象数目大于或等于聚类收稿日期:2022-10-21作者简介:王军,研究方向为交通管理。通信作者:高建杰,硕士,副教授,研究方向为交通管理。基金项目:2020年四川警察学院研究生创新项目“基于高清智能卡口数据的泸州市城区车辆动态OD矩阵获取方法”(项目编号:20YCX014)引用本文:

6、王军,高建杰.基于DBSCAN算法的城市交通小区划分J.智能城市,2023,9(2):80-82.智能规划NO.02 202381智能城市 INTELLIGENT CITY阈值(MinPts)定义原理相似。(3)算法优越性。使用DBSCAN算法可以快速实现交通小区划分工作,使用门槛低,应用场景广泛。DBSCAN聚类算法运算速度快,参数调整便捷,可实现不同规模大小的交通小区划分,能够满足不同的需求分析。2DBSCAN聚类算法简介DBSCAN算法是一种非常实用的基于密度的聚类算法,可以对稠密型数据集进行聚类,不受形状和大小的限制,具有优良的抗干扰性,在交通地理研究领域中使用广泛。DBSCAN聚类算

7、法针对输入的样本数据集,首先定义一个半径参数,依据半径参数范围在输入的样本数据集中查找数据点,对查出的数据点进行分类处理5。基本流程为:对输入的样本数据集A,从中任意选择一个未检测的样本点a,判断样本点a的Eps邻域内的样本数量与MinPts的大小,当样本点a的Eps邻域内的样本数量大于或等于MinPts,则按照定义判断样本点a为核心点,依托核心点a新建一个簇B,从输入的样本数据集A中找出所有从核心点a出发的直接密度可达点,所有满足点a的Eps邻域内的点均认为是满足簇B要求的点,应当划分为同一类别。当遍历并处理完A中所有点后,聚类结束。3实例应用文章基于DBSCAN算法,对四川省泸州市主城区内

8、所有的高清智能卡口的地理位置数据进行聚类,根据聚类结果结合交通小区划分的相关原则进行交通小区划分。3.1数据收集对泸州市城区的高清智能卡口设备的地理经纬度信息、卡口名称和ID编号进行收集,共收集整理380个高清智能卡口设备的经纬度信息。为确保各高清智能卡口的ID编号、名称与采集的数据一一映射、相互匹配,保证位置信息的精准度,为下一步计算OD矩阵做准备,需要对收集的高清智能卡口设备的地理数据进行处理。(1)统一卡口名称。将收集的卡口地理位置信息中包含的设备名称,按照实际采集的高清智能卡口设备名称进行更改,确保相同名称的高清智能卡口的ID编号相同且唯一。(2)规范数据格式。各高清智能卡口地理数据的

9、格式需要进行规范统一,将不同格式的地理数据统一为相同格式,严格按照地理坐标经纬度数据统一设置。(3)校验卡口数据。将整理后的高清智能卡口地理位置信息导入Python中,运用Python第三方可视化库Plotly,将整理后的信息在具体路网中展现。对有明显错误的地理位置信息进行实地调查,经核实后更正坐标数据,按照统一的数据格式记录,最终得到高清智能卡口地理位置信息数据表。3.2基于DBSCAN算法划分交通小区城市路网中高清智能卡口设备的地理位置数据信息,直观反映了各高清智能卡口间的行程距离。文 章 首 先 加 载 了 Python 的 第 三 方 库(Pandas、Geopandas、Shapel

10、y、Sklearn等),采用Python编程的方式,对高清智能卡口地理位置数据进行DBSCAN聚类。(1)高清智能卡口地理坐标转换。对高清智能的经纬度地理坐标数据,转换为平面坐标数据后,进行DBSCAN算法聚类。文章整理的卡口地理坐标数据属于EPSG:4326地理坐标系,进行聚类分析前,需要将所研究的卡口地理坐标数据转换为EPSG:32650平面坐标系,得到各个高清智能卡口的平面坐标数据。(2)DBSCAN算法聚类。导入Python的第三方数据库sklearn,利用Python编程对地理坐标转换后得到的高清智能卡口平面坐标数据采用DBSCAN算法进行聚类。考虑到研究范围内属地边界卡口点位少而疏

11、,因此设定聚类算法的最小样本数量为1;将泸州市城区所有高清智能卡口聚类的半径参数设定为500 m,得到不同卡口密集度和路网复杂度的高清智能卡口聚类结果。(3)存储含有聚类结果的数据文件。聚类后的数据文件包含高清智能卡口名称、高清智能卡口经度、高清智能卡口纬度、高清智能卡口标签值、高清智能卡口编号等字段信息。将聚类后的数据值(处于同一类的卡口有相同的值)新增到原有的高清智能卡口地理坐标数据中,并新增为“Label”列。将聚类后的数据值增添到高清智能卡口平面坐标数据新增的Label列中。使用Python自带的OS模块,保存含有聚类结果的两个高清智能卡口位置数据文件,存储为CSV文件以及输出后带有地

12、理坐标位置信息的Shp格式文件。利用Python第三方matplotlib绘图库,绘制聚类后按颜色分类的高清智能卡口平面坐标分类图如图1所示,同一颜色的点代表聚类结果为同一类的高清智能卡口。智能规划NO.02 202382智能城市 INTELLIGENT CITY3.3交通小区划分结果通过上述步骤得到含有卡口地理位置标签信息的数据文件,结果显示,采用DBSCAN聚类算法,将泸州市主城区划分为91个交通小区。按照城市交通小区划分原则,一般交通小区平均面积为12 km2,泸州市城区现有面积约120 km2,划分后平均每个交通小区面积为1.34 km2,聚类结果符合实际要求。交通小区划分基本原则6:

13、尽量不打破城市的行政区划分,确保交通小区的土地使用、经济社会特性一致;综合分析城市路网构成,尽力使小区划分与城市路网融合一致,不以干道作为交通小区的划分界线,尽可能使道路两侧区域处于同一个交通小区中;尽量以铁路、江河等天然屏障作为交通小区的自然分区,避免人为设置交通小区障碍线;交通小区划分形状应尽可能规则,避免出现狭长形区域。综合分析高清智能卡口地理位置数据的聚类结果,使用AutoCAD绘制得到泸州市主城区的交通小区划分示意,如图2所示。3.4聚类结果评估聚类算法的目的是将样本数据集划分为若干不相交的子集,每个子集成为一个簇。最佳的聚类结果是同一簇内的样本集相似度最高,不同簇的样本集相似度最低

14、,文章采用轮廓系数对聚类效果进行评价。轮廓系数适合用于无监督学习中样本数据集类别未知的情形。对于某个样本的轮廓系数s,轮廓系数公式:s=b-amax(a,b)(1)式中:a某样本点与其所在簇内的其他样本点之间的平均距离;b某样本点与其他簇样本的平均距离。对于一个样本集,聚类为N个簇后的总轮廓系数SC表示为:SC=1Ni=1NSC(si)(2)轮廓系数的取值范围为-1,1,同簇的样本点距离越小,不同簇的样本点距离越大,则聚类效果越好,此时,轮廓系数越接近于1。结果显示划分交通小区后的轮廓系数SC为0.853,满足聚类的评估要求,采用DBSCAN聚类算法进行交通小区划分,划分结果可以用于OD调查。

15、4结语文章分析了DBSCAN聚类算法流程和评估参数,以泸州市主城区高清智能卡口为聚类对象,基于卡口系统的地理坐标经纬度静态数据信息进行DBSCAN聚类,结合交通小区划分的基本原则,实现交通小区划分的目的,对划分结果进行了可视化展示,采用轮廓系数对聚类结果进行了评估,证实采用DBSCAN聚类算法划分交通小区具有可行性和有效性。参考文献1 宋亮.交通小区的理论分析和划分方法研究D.西安:长安大学,2011.2 李明.基于出行相似性的交通小区划分方法研究D.北京:北京交通大学,2019.3 唐娟.基于手机定位数据的居民出行OD矩阵获取方法研究D.成都:西南交通大学,2016.4 杨滨毓.基于多源数据的交通小区划分方法研究D.哈尔滨:哈尔滨工业大学,2020.5 孙超.需求驱动下交通小区划分方法与应用研究D.哈尔滨:哈尔滨工业大学,2021.6 郭峤枫.浅析交通小区划分问题J.黑龙江科技信息,2010,(28):270,269.图1聚类后高清智能卡口平面坐标颜色分类图2泸州市城区交通小区划分示意

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2