1、信息通信基于大数据与GIS地图的外来务工人员聚集区域场景识别与探究计潇怡,魏国华,张玉红,王海舰(中国移动通信集团内蒙古有限公司,内蒙古呼和浩特0 10 0 10)摘要:为了主动挖掘务工客户需求,寻找外来务工人员聚集区域,本文基于运营商大数据分析能力,提出了一种外来人员聚集区域的识别方法,并依据网格区域划分规则,将识别结果下沉至微格。为了方便业务人员的使用,同步建立了一套基于GIS地图及H5页面的手机端展示能力,提升了系统展示的直观性及业务人员使用的便捷性。业务人员根据外来人员区域分布特点,制定相应的营销场景及策略,并将任务下发到一线网格人员手中。网格人员根据工具指引,到达相应区域,面向务工人
2、员开展营销,从而形成一套完整的、面向外来务工人员的营销场景,推动外来务工市场的发展。关键词:外来务工人员;微格;GIS地图中图分类号:TP309Identification and Exploration of Scenarios in the Gathering Area ofMigrant Workers Based on Big Data and GIS MapsJI Xiaoyi,WEI Guohua,ZHANG Yuhong,WANG Haijian(China Mobile Inner Mongolia Co.,Ltd Inner Mongolia Hohhot 010010)Ab
3、stract:In order to actively explore the needs of migrant workers and find the areas where migrant workers gather in otherprovinces,this paper proposes a method to identify the areas where migrant workers gather in other provinces based on the bigdata analysis ability of operators,and according to th
4、e rules of grid region division,the identification result is reduced to micro-grid.In order to facilitate the use of business personnel,a set of mobile terminal display ability based on GIS map and H5 page hasbeen established synchronously,which improves the intuitiveness of system display and the c
5、onvenience of business personnel.According to the regional distribution characteristics of external personnel,business personnel formulate corresponding marketingscenarios and strategies,and distribute the tasks to the first-line grid personnel.Grid personnel arrive at the corresponding regionsaccor
6、ding to the tool guide and carry out marketing for migrant workers,thus forming a complete set of marketing scenarios formigrant workers and promoting the development of migrant workers market.Key words:Migrant workers;Micro grid;Geographic information science map1 引言伴随移动互联网技术的不断发展,手厅、微厅等多种线上互联网业务办理
7、渠道不断涌现,方便了用户的同时,也导致了进入传统营业厅办理业务的用户不断减少。由于进厅客户的减少,运营商直接接触客户的机会也不断减少,尤其是外来务工人员,由于其工作时间长、工作地经常变化等原因,导致与其接触的机会愈发渺茫。因此,针对务工市场,从营销的角度来看,运营商不可能再坐等客户上门,需要改变策略,主动去挖掘客户需求,通过不同的场景去寻找不同需求的客户,需要用更广泛的触点和更便捷的工具来方便一线触达客户,服务客户。为了建立一套完整的、面向外来务工市场的营销体系,本文利用大数据建模,通过模型识别和圈定外来人员聚集区域,并基于智慧网格运营平台,将聚集区域与网格关联,市场人员分析并制定外来务工人员
8、聚集区域营销场景,将任务及务工人员分布区域通过特定工具下发到网格,指导一线网格开展专项营销。收稿日期:2 0 2 3-0 2-0 6作者简介:计潇怡(19 7 7-),女,内蒙古兴安盟人,通信工程高级工程师,现任职于中国移动通信集团内蒙古有限公司,主要研究方向:行业内支撑方案设计、智慧运维、业务数据管理与分析、人工智能应用、大数据行程卡等;魏国华(19 8 3-),男,内蒙古乌海人,高级工程师,高级信息系统项目管理师,现就职于中国移动通信集团内蒙古有限公司,硕士研究生,主要研究方向:行业数据分析、大数据应用。322023年第0 5期(总第2 45期)文献标识码:A文章编号:2 0 9 6-9
9、7 59(2 0 2 3)0 5-0 0 32-0 32外来务工人员聚集区域营销场景研究2.1问题分析在开展外来务工市场运营方面,主要面临以下问题:(1)业务发展推动用户识别模式转变工信部在2 0 19 年底开启了携号转网业务的发展,各大运营商积极响应,在短时间内就完成了功能的建设。随着携号转网业务的上线,单纯通过手机号段归属的方式判断用户来源的方法已经不再适用。从2 0 17 年开始,国家陆续取消了语音长途漫游费及流量漫游费的收取。漫游费用的取消,使得更多的外来用户会放弃换号,继续使用旧号码通信。因此,单纯使用省内语音话单识别外来用户的方式已不够全面。(2)对新技术的应用不足仍在使用传统的关
10、系型数据库做数据分析,使用的数据也局限在运营商传统的语音及流量话单,可分析的维度及数据量级有限。基于用户位置的信令数据源并未引入,大数据技术及分析能力未应用,无法实现对用户位置的快速、准确定位。Changjiang Information&Communications(3)缺乏有效的工具支撑,难以改变传统营销方式进厅客户的减少,使得坐等客户上门的营销方式已经不能满足当前市场的发展需要。在外来务工人员的营销方面,一线人员没有任何支撑工具,无法获取到有效的务工人员聚集区域及相关信息,对实际营销效果产生很大影响。针对以上的问题,通过研究与思考,从以下几方面制定方案,以适应新的务工市场发展要求。第一,
11、充分利用大数据平台的能力,通过模型建设精准识别外来务工人员聚集区域。在HADOOP平台,通过 Storm组件完成MR、M M E等用户位置信令数据的实时接入,在GBase数据库完成数据汇总,并结合用户语音、流量话单数据及用户身份信息等数据,完成对外来务工人员及其聚集区域的识别。第二,建立一套面向务工市场的专属工具。为了便于一线人员营销,基于GIS地图打造一套可视化工具,实现任务的下发和信息的展示。第三,主动挖掘务工人员诉求,建立一套面向务工市场的专项营销方案,实现进场营销,提升营销成功率。2.2构建外来务工人员聚集区域识别模型利用运营商大数据技术及业务分析能力开展模型建设工作,分析对象为内蒙古
12、自治区某地市外来务工人员及其聚集区域。数据分析周期:模型以月为周期,次月生成模型结果数据,分析数据为当月该地市常驻人口。业务口径定义:选取一个月呼市常驻人口,针对外来人员(号段或户籍地非内蒙古),查找其在工作时段(每日9:0 0-18:00)驻留时间最长的基站进行分析。驻留基站的计算,是基于大数据平台,在完成用户语音、流量、MME、M R 等数据的接入和汇总后,进行位置的计算和排序,从而统计出用户每日在各基站下的驻留时长,为后续分析做准备。基于大数据的外来务工人员聚集区域识别模型建设流程主要分为以下七步:(1)获取上月某地区常驻人口。月常驻人口定义:按月汇总分析大数据平台用户语音、流量及位置信
13、令数据,选取用户每天在两个时间段(白天工作时间9:0 0-18:0 0、夜晚居住时间19:00-次日8:0 0)累计驻留满2 小时以上的基站,从每日的两个时间段中各自选取累计驻留时间最长的Top5基站,作为当获取地区月常驻人口外来务工人员聚集区域识别模型建设流程见图1。通过模型构建,能有效地识别出外来人员白天的聚集区域,由于同步剔除了一些特定的场景区域,从而能够保证了更高的识别准确性,为后续一线网格人员的运营提供了准确的信息和帮助,降低网格人员信息收集的人工成本。2.3系统可视化展示功能建设在底层识别模型能力建设的基础上,进一步建立平台展示功能。为方便业务人员使用,展示界面调用了大数据平台GI
14、S地图的图层煊染功能,通过开发手机端H5页面的方式调用GIS地图展示功能,业务人员在客户端进行用户鉴权,并根据其角色信息确定可访问范围。33计潇怡等:基于大数据与GIS地图的外来务工人员聚集区域场景识别与探究天常驻工作/居住基站。在一个月中,从日常驻工作/居住基站簇中,筛选出当月至少出现过5天的基站(若用户在同一基站下的驻留天数小于5天,则认为该用户并非当月常驻用户),再各自从中选取驻留天数最多的Top5基站,作为当月该用户的常驻工作/居住基站簇。以上是对月常驻人口的完整定义,在本次模型建设中,由于目标是选取外来务工人员的工作聚集区域,因此,仅使用到月常驻人口中的常驻工作基站簇即可满足建模需要
15、。(2)确定本地常驻人口中的外来人员:从上月常驻工作人口中,选取身份证号码非内蒙古归属,或者手机号段非内蒙古地区的人员,将其认定为上月常驻人口中非内蒙古地区的外来入蒙人员。(3)确定外来人员工作时段驻留时间最长的基站:提取外来入蒙人员号码一个月内,在上午9 点到下午6 点之间驻留的基站,筛选出在此时间段内累计驻留时长大于2 小时的基站,并在此基础上选取累计驻留时间最长的top5基站,作为该用户工作时间驻留时间最长的基站。(4)基于GIS地图,利用大数据爬虫技术,提取该地市各大高中专院校、医院、大型商场等特殊场景地的POI信息,计算POI点50 0 米范围内的所有基站。(5)在工作时间段驻留时间
16、最长的基站中,剔除各大高中专校、医院、大型商场等特殊场景地范围内的基站。由于这些特殊场景地存在外来人员聚集的可能性,但这些区域并不属于真正的外来务工场所。(6)基于GIS地图计算各微格与基站的对应关系,将目标基站划分到每个微格中。计算出的目标基站中,外来人员驻留数量大于50 人的基站,并选定每个微格内驻留人数最多的Top10基站,作为模型最终的目标基站。利用基站驻留人数和基站的经纬度信息,在GIS地图上进行打点,标记基站位置,并绘制热力分布图。(注:微格是指根据人口分布情况建立的、由系统在GIS地图上提前划分好的闭合区域,是运营的最小区域单元)(7)提取满足在热力图上打点要求的用户明细数据,得到微格内的人口数据,关联获取人员的户籍所在地信息、微格内的所有常驻人口数、外来人口数、外来人口占比、外来人口来源分布等信息,为后续运营提供更全面的参考。计算外省人员常提取高校、医院、确定常驻人口中驻工作基站的外省人员TOP5图1外来务工人员聚集区域识别模型建设流程图计算POI区城覆大型商场POI信盖基站,并从常息驻基站中剃除在平台能力方面,使用人员可以根据地市、旗县、网格、微格四个维度进行查询区域