1、2023 年 2 月第 1 期城市勘测Urban Geotechnical Investigation SurveyingFeb2023No1引文格式:黎德华,汤江龙,邹自力 基于格网 GIS 的南昌市中心城区公共服务设施可达性研究 J 城市勘测,2023(1):4550文章编号:16728262(2023)014506中图分类号:P208文献标识码:A基于格网 GIS 的南昌市中心城区公共服务设施可达性研究黎德华*,汤江龙,邹自力*收稿日期:20220420作者简介:黎德华(1999),男,硕士研究生,研究方向:国土空间规划与城市发展。Email:648654878 qqcom通讯作者:汤江
2、龙(1964),男,博士,教授,研究方向:国土资源与管理、土地信息技术。Email:jltang ecuteducn(东华理工大学 测绘工程学院,江西 南昌330013)摘要:以南昌市中心城区为研究区建立格网单元,利用高斯两步移动搜索法计算南昌市中心城区五类公共服务设施的可达性,结合洛伦兹曲线和基尼系数评价公共服务资源的公平性等级。在可达性研究的基础上,根据研究区内公共服务设施的供需配置现状,采用 Kmeans 聚类算法进行组合分区。结果表明:南昌市中心城区不同公共服务设施的可达性格局存在较大差异,其中教育资源公平性等级最高,商业、文体资源的公平性相对合理,公园、医疗资源的公平性较差。依据公共
3、服务设施的供需配置现状,可以将南昌市中心城区划分为 5 个组合分区,分别是高需求中可达性区、中需求高可达性区、中需求中可达性区、低需求高可达性区、低需求低可达性区。关键词:格网 GIS;公共服务设施可达性;公平性评价;Kmeans 聚类分区1引言公共服务设施是指能够为居民日常生活提供各类公共产品和服务的空间载体1。可达性指的是从一点到另一点的难易程度2,空间可达性评价方法是衡量公共设施空间布局公平性的有效途径3。用于度量可达性的方法大致分为四类,其中基于空间相互作用的方法最为全面,应用也最为广泛4。当前可达性评价最常见的潜能模型法5 和两步移动搜索法6 都是基于空间相互作用的思想。两步移动搜索
4、法(2SFCA)作为潜能模型法的一种特例,早期由 adke7 和 Luo8 分别提出并加以命名,后来 Dai 在医疗9 和绿地10 的可达性评价中引入高斯函数刻画距离衰减,发展出高斯两步移动搜索法(Ga2SFCA)。既有文献主要围绕单类公共服务设施的可达性分析,角度较为单一,缺乏对多类公共设施可达性水平的比较研究,难以对研究区的公共设施布局展开综合性评价。此外,公共设施可达性评价容易受到可塑性面积单元问题的影响,不同的空间单元尺度和区划方法可能导致可达性评价结果的差异,通过采用精细尺度空间数据,能总结出更为可靠的研究结论1。目前公共服务设施可达性评价以街道11、县区12 等行政单元为主,往往容
5、易忽略了单元内人口数据的非均质特征,导致微观空间尺度下的公共服务设施可达性测算产生失真的现象13。格网 GIS 是一种空间分析手段,是GIS 在网格环境下的一种应用,即利用水平线与垂直线相互交叉组成的间隔均匀的网络划分地理空间数据,以识别地图上的各个位置14。基于格网 GIS 的可达性分析突破了以行政区为单元进行数据信息挖掘的固有模式,使可达性评价结果更趋于可靠。鉴于过往可达性研究的成果和不足,本文选取南昌市中心城区为研究区,利用 GIS 建立 1 000 m1 000 m的人口格网单元作为两步移动搜索法的公共设施需求格网,以人口格网重心为需求点,以教育、公园、医疗、商业、文体五类设施点作为基
6、本公共服务供给点。在确定供需点位置和规模的基础上,利用高德地图 API 的路线规划功能批量获取供需点之间的出行时间成本,计算需求点访问不同公共设施的可达性水平,借助洛伦兹曲线和基尼系数分析法比较不同公共服务设施的公平性等级。通过 Kmeans 聚类算法得到五类设施点的供需组合分区,以精细化角度剖析公共设施可达性空间差异的成因,评价现有公共设施的供需配置状况。2研究区域与数据2.1研究区概况南昌市下辖6 个市辖区、3 个县、3 个城市功能区,中心城区由5 个市辖区(东湖区、西湖区、红谷滩新区、青云城市勘测2023 年 2 月谱区、青山湖区)和两个城市功能区(南昌市经济开发区、高新技术开发区)所组
7、成。考虑到新建区中心自撤县建区以来发展迅速,本文研究范围将囊括中心城区和新建区的长堎镇。研究区的行政区划及具体位置如图1 所示。图 1南昌市中心城区行政区划及区位图南昌市中心城区以赣江为界呈现出“一城两核”的规划格局,形成了庞大的城市道路网络和便捷的公共交通系统。截至 2021 年,南昌市中心城区公交运营线路 288条,公交站点 500 m覆盖率达100%;市内已建成四条轨道交通,日均客运量为52.7 万人次 15。公共交通已经成为城市居民日常出行的首选方式。在后续的可达性分析中,设施点和需求点之间的通行距离将以高德地图公共交通出行模式下的出行时间距离表示,从而真实地反映居民普遍获取基本公共服
8、务的便利程度。2.2需求单元数据首先,建立由949 个 1 000 m1 000 m格网单元所组成的格网覆盖区域,连接 Worldpop 的人口空间数据集。Worldpop 是基于夜间灯光数据、土地利用数据、到各类土地利用类型的距离因子和高程信息,通过随机森林模型估算得到的人口数据集 16。由于模型估算数据相较于实际普查数据存在时效性偏差,理应结合最新的南昌市第七次全国人口普查数据对 Worldpop 的 2020 年人口格网数据进行修正,进一步提高人口空间数据的精确性。表 1所示的人口修正系数是南昌市各区第七次全国人口普查数据与 Worldpop 人口数据相除的商。每个格网的原始人口数据与修
9、正系数相乘可以得到人口修正数据。图 2 是修正后的南昌市人口密度分布格局。表 1南昌市各区第七次人口普查数据与 Worldpop 人口数据及其修正系数东湖区西湖区青云谱区红谷滩区青山湖区新建区经开区高新区第七次人口普查数据/人421 960485 161349 074555 755662 582810 614463 331447 146WorldPop 人口数据/人651 508640 924453 175323 124446 773729 187448 695299 201人口修正系数0647 70757 00770 31719 91483 01111 71032 61494 5图 2南昌市
10、中心城区人口密度分布图2.3供给单元数据综合可达性研究要选择具有代表性的服务类型。如表 2 所示,根据城市居民日常生活需要和既有文献的研究经验17,本文筛选出教育、公园、医疗、商业、文体五类公共服务设施,其中教育设施分为小学和中学,文体设施分为大型运动场所、博物馆和图书馆。设施点的数量、类型和位置均来源于高德地图搜索服务API 开放共享的兴趣点(POI)数据,数据采集时间为2021 年 12 月。高斯两步移动搜索法需要明确供给点规模以及供需点之间的极限通行时间,关于各类设施点供给规模的衡定标准以及通行时间阈值则参考了相关研究文献17,18。供给规模数据来源于政府公开的机构名录、各事业单位官网、
11、各大门户网站或点评网站等,结合百度街景分析、遥感目译以及实地调查等方法对数据进行修正,以此确保数据的有效性。表 2公共服务设施的数量及通行时间阈值设施分类具体设施点供给规模标准数量通行时间阈值/min教育设施中学小学占地面积/m21204015840公园设施公园占地面积/m25760医疗设施综合医院床位/个14060商业设施购物中心建筑面积/8660文体设施大型运动场所占地面积/m248博物馆馆藏品件数/个15图书馆馆藏纸质图书数/万册31603研究方法3.1高斯两步移动搜索法地理学第一定律指出,“任何事物都是与其他事物相关的,但是越相邻的事物关联性越强。”早期两步移动搜索法假设人们只寻求人口
12、所在地的基本公共服64第 1 期黎德华,汤江龙,邹自力.基于格网 GIS 的南昌市中心城区公共服务设施可达性研究务,并且无论服务供给点离需求点多远,只要在通行时间内的需求点都能平等地访问所有服务供给点19。该假设意味着,人们在服务区域内访问站点没有距离障碍,这明显与地理学第一定律不符。有鉴于此,Dai将高斯函数与两步移动搜索法相结合,使用高斯函数计算服务半径内可达性的距离衰减,改进了早期两步移动搜索法的不足。其计算过程如下:第一步:以设施点为供给点,人口格网重心为需求点,通行时间阈值为服务半径,汇总在服务半径范围内所有人口数量,根据高斯函数赋以距离衰减权重,计算各个设施点的供需比 j:j=Sj
13、idijd0G(dij,d0)Pi(1)式中:Sj是设施点 j 的供给规模,Pi是需求点 i 的人口数量;dij表示需求点 i 到设施点 j 的距离,d0表示供需点之间的通行时间阈值;G(dij,d0)是表征距离衰减程度的高斯函数,距离越远,设施点服务能力越差。如果 dij大于通行时间阈值 d0,则表示该需求点 i 不属于设施点 j 的服务半径之内,衰减权重取 0 值。高斯函数具体形式如下所示:G(dij,d0)=e12dijd0()2e121e12(dijd0)0(dijd0)(2)第二步:以需求点为搜索中心,搜寻不超于通行时间阈值的所有设施点,汇总每个设施点供需比 j与相应高斯衰减权重 G
14、(dij,d0)的乘积,即可得到各个需求点的可达性 Ai。可达性计算公式如下所示:Ai=j dijd0G(dij,d0)j(3)3.2洛伦兹曲线与基尼系数洛伦兹曲线是美国统计学家 MO 洛伦兹提出的一种公平性测量方法,可以用来评价社会收入分配或资源分配的公平程度。绘制洛伦兹曲线有两个步骤,第一步,按照收入或资源类型的差异将不同人群分为若干等级,计算每个单元占总单元的百分比,进行升序排列并逐步累加,以此表示为纵轴。第二步,将研究区的人口累计比例从小到大排列并表示为横轴。最后连接各点即可构成洛伦兹曲线。基尼系数又称为不均等指数或洛伦兹系数,可以用来量化国家或地区以及社会收入分配公平程度或社会财富占
15、用状况的宏观经济指标。基尼系数等于绝对公平线与洛伦兹曲线围成的面积与绝对公平线下直角三角形面积之比,通过应用连成洛伦兹曲线上累积统计点之间的折线所构成的梯形面积能够计算得到基尼系数 20。3.3Kmeans 聚类算法Kmeans 聚类属于机器学习领域的无监督聚类算法,通过给定相似性度量将数据分为若干个独立的簇,使得同一簇内的数据点尽可能相似,不同簇间的数据点尽可能差异。Kmeans 聚类有着集群初始化策略和高计算效率的优势,能够减少人工分区的误差21,解决选址中心个数不定和位置不明的问题22。聚类算法是一种无监督的学习算法,一般情况下并不清楚最佳分类数目。本文利用轮廓系数法评估不同聚类数目的效
16、果。轮廓系数越大,聚类质量则越好,轮廓系数达到最高值时对应的聚类数目可作为最佳新增设施点数目。轮廓系数计算公式如下图所示:S=bamax(a,b)(4)式中:S 是轮廓系数,其数值介于1,1之间;a表示样本点与同一簇中所有其他点的平均距离;b 表示样本点与下一个最近簇中所有点的平均距离。4研究结果与分析4.1公共服务设施可达性格局分析由于部分需求点在通行时间阈值之内没有可访问的设施点,导致可达性水平为空值。本文采用克里金插值法对可达性为空值的需求格网进行空间插值,利用自然间断法把插值结果分为 6 级。图 3 展示了可视化处理后五类公共设施可达性的分异格局。红色格网代表可达性水平最高,深绿色格网代表可达性最低,其余等级依颜色顺序排列。与其他设施可达性的分异格局图相比,图 3(A)的深绿色格网更少,其余颜色格网在区域内均有分布,这意味着有更多的需求格网能够访问教育设施点,反映出南昌市中心城区教育设施的空间配置是比较合理的。总体上看,赣江西岸可达性高于东岸,高值格网主要集中在红谷滩区中部的沙井街道和九龙湖片区,低值格网遍布中心城区边缘。图 3(B)显示,公园可达性高值区主要散布南昌市中心城区