1、第 42 卷第 3 期重 庆 交 通 大 学 学 报(自 然 科 学 版)Vol 42No32023 年 3 月JOUNAL OF CHONGQING JIAOTONG UNIVESITY(NATUAL SCIENCE)Mar 2023DOI:103969/jissn1674-069620230318公交一票制乘客精细化分类研究李军,区静怡,赵文婷(中山大学 智能工程学院,广东 广州 510006)摘要:构建了一种可应用于公交一票制下的乘客精细化分类方法。针对公交一票制仅有上车信息的特点,从乘车强度、时间特性、空间特性及高峰特性构建分类指标,并利用相关性分析进行指标筛选;然后应用 Two-St
2、ep 聚类对乘客进行聚类,将乘客分为清晰簇和非清晰簇,并对清晰簇和非清晰簇再次选取特征指标进行 2 次聚类以实现乘客的精细化分类。根据广州市的算例表明,该方法可以对乘客进行有效分类,每类结果对乘客的出行特征进行了细致地刻画,分类方法有效且稳定。关键词:交通工程;公交一票制;乘客分类;出行特征;组合聚类中图分类号:U121文献标志码:A文章编号:1674-0696(2023)03-128-07efined Classification of Transit iders under Bus One-Ticket SystemLI Jun,OU Jingyi,ZHAO Wenting(School
3、of Intelligent Systems Engineering,Sun Yat-sen University,Guangzhou 510006,Guangdong,China)Abstract:A refined classification method of transit riders under bus one-ticket system was proposed Firstly,due to thecharacteristics of the bus one-ticket system,only boarding information is available The cha
4、racteristic indexes of the riders,namely,the travel intensity,temporal indicators,spatial indicators and peak-hour indicators,were selected as the indexesof the classification The correlation analysis was employed to screen indicators Then,Two-Step clustering was used tocluster transit riders into c
5、lear clusters and unclear clusters Moreover,feature indicators were selected again for clearclusters and unclear clusters for secondary clustering to achieve the refined classification of passengers A case study on thetransit riders data of the one-ticket bus system in Guangzhou shows that the propo
6、sed method can effectively classifypassengers,and the results of each class depict the travel characteristics of passengers in detail The proposed classificationmethod is effective and stableKey words:traffic engineering;one-ticket bus;transit rider classification;travel characteristics;combinatoria
7、l clustering0引言随着移动互联网时代的多样化发展,公交出行给乘客带来了许多便利。大部分采取公交一票制的城市公交的付费方式不再拘泥于现金,而衍生出刷卡、NFC 以及二维码支付等多元化的支付方式。虽然支付方式不同,公交一票制下乘客在乘坐公交工具时仍只需要进行一次付费行为。公交一票制乘车体系仅记录乘客的上车时间和站点信息,对乘车距离有差异的乘客均采用统一的收费原则。由于该体系缺乏乘客下车时空信息,难以体现不同乘客的完整出行特征,因而给公交一票制下的乘客分类带来了挑战。目前乘客群体分类研究主要分为主观分类和客观分类 2 种基础类型。不同的乘客伴随着不同的社会经济属性,在主观分类中,乘客的个
8、人特征、家庭特征以及出行目的等均可作为分类的重要依据1-3 通过构建特征矩阵得到体现。乘客信息一般可通过收稿日期:2021-12-25;修订日期:2022-06-22基金项目:广东省重点领域研发计划项目(2019B090913001)第一作者:李军(1968),男,湖北江陵人,副教授,博士,主要从事交通规划与设计方面的研究。E-mail:stslijun mailsysueducn问卷调查获得,但调查群体量大,且存在主观性强的缺陷。同时,根据乘客刷卡的卡片类型,如学生卡、老年卡和普通卡等,存在预设乘客身份和行为特征的情况,易影响乘客分类客观性。因此客观分类可避免过强的主观性分类,通过客观因素建
9、立乘客分类模型,如出行强度、时间规律性、空间规律性等。针对出行强度和时间规律性,采用工作日高峰时段出行频率和时段等特征判断乘客活动频率与性质4-5。判断乘客的空间规律性时,一般采用出行距离或任 2 个站点的地理相近性进行体现,研究认为后者可取 1 000 m 以内的值作为判断值6-7。在选择聚类方法上,有研究从时间划分的角度使用 K-means 算法将乘客聚类成 3 类,在结合时间和空间的规律性上,可进行组合划分,但类别数较少8,或通过 DBSCAN 聚类算法9 与数据挖掘结合对乘客的出行行为进行分类;此外也有研究使用 Two-Step聚类算法10 并将乘客分成 5 种类型;通过细化出行强度的
10、定义和优化初始聚类中心,有研究使用混合类型的聚类算法11 将乘客分为 4 类;其中,各聚类算法各有优劣,K-means 算法是一种迭代求解的聚类分析算法,给定预定的分类数,逐步迭代直至最优,可使类别 内 的 平 方 误 差 最 小,而 类 别 间 差 距 明 显。DBSCAN 聚类算法优点在于不需要定义聚类个数,可识别任意形状的聚类,对于密度差距较大的簇则难以处理12;Two-Step 聚类算法包括预聚类和聚类,其优点在于能同时处理分类变量和连续变量,使用更为客观的 BIC 准则13,自动选择最佳簇数量。虽然上述聚类方法能在没有先验知识的情况下对研究对象进行分类,但仍存在单次聚类效果笼统的问题
11、11。上述以客观因素分类的研究中,对乘客的空间规律性分析均建立在可获取乘客上下车信息的情况,对于采用公交一票制的乘客分类适用性较低,且既有分类较为笼统,难以准确表示每一类别乘客的特征。已有研究可通过推断下车站点的方式对下车信息进行补全,如出行链匹配法或站点吸引权法14-16,但推断方法对数据要求较高,乘客分类结果准确率受站点推断结果的影响。综上所述,针对公交运营所采用的一票制付费情况,笔者从乘客的上车时空信息考虑,推导其乘车强度、时间特性、空间特性及高峰特性,提出一种可应用于公交一票制分类方法,使用组合聚类的方法构建一个全群体乘客的精细化分类模型,采用广州市公交乘客的刷卡数据对模型作实例分析,
12、并验证该分类模型的稳定性和有效性。公交乘客精细化分类模型可为公交服务运营优化、个性化公交服务和公交需求预测等带来新的契机。1乘客分类模型构造11分类指标构建考虑相关性、误差以及公交一票制所记录的上车信息数据,选取乘客在乘车强度、时间特性、空间特性以及高峰特性的表现对公交一票制乘客分类模型进行分析。111乘车强度乘车强度反应了乘客对某种交通方式的依赖性,根据公交一票制出行特点,分别以日和周为单位,乘客 k 的乘车强度表征项由以下 4 个指标构成:日均乘车次数 sk为乘客对公共交通的依赖程度;乘车周数 wk为以周为单位周期性出行强度;每周平均乘车天数 Ak为乘客单位周期内的公交利用程度;周乘车天数
13、标准差 k为指标 Ak的稳定程度。112时间特性由于公交一票制只有上车信息,因此围绕上车时间来构建这一指标。针对现实中存在大量的单日单次乘车用户的特点,笔者把全体乘客都具备的首次乘车行为作为重点的时间特性指标,而周期性的指标围绕工作日和非工作日进行构建。乘客 k 的时间特性由以下指标进行刻画:日均首次乘车时间 Tk为乘客在统计周期内的首次乘车时间平均值;日首次乘车时间标准差 k为乘客首次乘车时间 Tk的波动程度;周工作日平均乘车天数 k为乘客工作日的周期性公交利用程度;周非工作日平均乘车天数 Nk为乘客非工作日的周期性公交利用程度。113空间特性公交站点是体现乘客乘坐公交的空间规律的重要指标,
14、有研究表明乘客的首次和末次乘车站点有很大可能为居住地和活动目的地,且互为起点和终点17-18。考虑到一票制下的乘车行为无下车信息记录,选取乘车日的首次乘车和末次乘车来揭示乘客蕴藏的乘车空间特性。此外由于乘客对公交线路的选择不是唯一的,在出行端点区域内公交站点都有可能被选择,乘客在出行端点邻近区域的集中程度可以作为一项有效的分类指标,该指标值越高,表明其空间规律性越高。我国对常规公交和轨道交通的站点服务区域分别是以 500 m 和 800 m 为半径计算时,覆盖率不得低于 90%,因此可以设定相邻站点之间距离 是否小于 5001 000 m 来判断任意两个站点是否可认为是乘客在乘车时可同时考虑的
15、邻近站点。假设乘客921第 3 期李军,等:公交一票制乘客精细化分类研究k 在总研究周期范围内的总乘车天数 Dk大于 1 d,分别计算其日首次和末次乘车站点邻近指数。1)日首次乘车站点邻近指数 PFk:PFk=Dki=1Dkj=1kijDk(Dk 1),kij=0,SFkij i=j1,SFkij i j(1)式中:F 为乘客 k 的日首次乘车行为;SFkij为乘客 k 在第 i 个乘车日和第 j 个乘车日的首次乘车站点距离;kij为站距判断值。2)日末次乘车站点邻近指数 PLk:PLk=Dki=1Dkj=1kijDk(Dk 1),kij=0,SLkij i=j1,SLkij i j(2)式中
16、:L 为乘客 k 的日末次乘车行为;SLkij为乘客 k 在第 i 个乘车日和第 j 个乘车日的末次乘车站点距离;kij为站距判断值。当乘客 k 的总乘车天数 Dk为 1 d 时,上述 2 项指标无意义,本研究设定其指标值 PFk、PLk均为1。114高峰特性工作日的公交出行人群存在大量通勤者,有着明显的早晚高峰特征,而在非工作日内则较不明显。乘客在工作日早晚高峰时段的乘车站点邻近指数,可对乘客的通勤特征进行刻画,乘客在所给定的高峰时段中乘车站点规律性越强,则其指标取值更高。在统计时段内有多次乘车行为的乘客 k,分别计算早晚高峰指标公式如下。1)工作日早高峰首次乘车站点邻近指数 PMk:PMk=DMki=1DMkj=1kijDMk(DMk 1),kij=0,SMkij i=j1,SMkij i j(3)式中:M 为乘客 k 的工作日早高峰首次乘车行为;DMk为乘客 k 在工作日早高峰有乘车行为的总乘车天数;SMkij为乘客 k 在第 i 个工作日早高峰有乘车行为的和第 j 个工作日早高峰有乘车行为的首次乘车站点距离。2)工作日晚高峰首次乘车站点邻近指数 PEk:PEk=DEki=1DE