1、信息通信基于多维大数据的用户画像构建及应用探究杨欢欢(中国联合网络通信有限公司新疆维吾尔自治区分公司,新疆乌鲁木齐8 30 0 0 0)摘要:通信运营商市场从“人口红利”时代转向“人心红利”时代,市场营销和服务质量提升都需要精细化到用户粒度。作为用户与互联网的信息通道,运营商汇聚了海量高价值数据,是企业数字化转型发展的重要基础。文章首先对大数据及用户画像的重要作用进行了概述,然后阐述了构建运营商用户画像的流程和更新选代方案。最后利用用户画像数据在潜在换机预测、5G网络引流和宽带网络满意度提升场景下进行应用探索,取得了显著效果。本次研究是对运营商大数据的创新运用,有助于提高电信运营商网络及服务质
2、量,提升客户满意度。关键词:大数据;用户画像;潜在换机;满意度中图分类号:TP311文献标识码:AUser porfile construction and application exploration based on multi-dimensional big data(Xinjiang Branch of China United Network Communications Group Co.,Ltd.Urumqi 830000,Xinjiang)Abstracts:The operator market has shifted from the era of Demographic
3、 dividend to the era of Popularity dividend,and theimprovement of marketing and service quality needs to be refined to the granularity of users.As an information channel betweenusers and Internet,operators aggregate massive amounts of high-value data,which is an important foundation for the digitalt
4、ransformation and development of enterprises.This paper first summarizes the important role of big data and user profile,thenelaborates the process of constructing operators user profiles and update iteration schemes.Finally uses user profile data to ex-plore applications in scenarios of potential t
5、erminal replacement prediction,5G network traffic migration and broadband net-work satisfaction improvement and remarkable results were achieved.This research is an innovative application of operatorsbig data,which helps to improve telecom operators network and service quality and improve customer s
6、atisfaction.Keyword:Big data;user profiles;potential terminal replacement;satisfaction1 引言随着移动互联网的快速发展,信息技术与人类生活的各个领域交汇融合,使数据量爆炸式增长。云计算、人工智能技术的进步,使得海量数据的挖掘和运用成为可能,并且得到更多人的认可。电信运营商作为用户与互联网的纽带,从多年前就开始构建其大数据基础设施,通过存储和分析用户的消费行为和兴趣偏好进行精准获客,或根据业务规模信息进行基站规划建设等。以往运营商内数据的运用大多在扩大用户规模方面,随着传统通信市场的饱和,怎样提升存量用户价值、
7、提高用户满意度、实现精细化管理成为运营商运用大数据技术进行企业管理、价值运营的新领域。例如,在新冠疫情期间,根据用户轨迹生成的通信行程卡对防疫工作也发挥了重要作用,凸显了大数据在经济社会的各方面都有极大价值。本文通过对运营商内部的多个业务系统数据源进行梳理整合,利用大数据及人工智能分析算法,以“标签化”的方式,建立了用户多维度的“画像”,形成一套具备多场景能力、不断迭代优化的用户画像系统。在5G网络规模发展的契机下,对潜在换机用户预测,5G网络引流、客户满意度提升方面进行了应用和探究,推进运营商大数据在新领域的创新应用。2用户画像构建用户画像是使用标签表征用户的属性和特点,以达到描述用户的目的
8、,是将用户海量的统计学信息、社交关系、消费行为和偏好习惯等数据进行整合而抽象出来的标签化画像。用户画像的构建,是以数据为核心,利用挖掘技术探寻用户需收稿日期:2 0 2 3-0 2-0 7作者简介:杨欢欢(19 8 9-),男,河南南阳人,硕士,主要研究方向:云网平台运维优化、网络运营分析。2092023年第0 5期(总第2 45期)文章编号:2 0 9 6-9 7 59(2 0 2 3)0 5-0 2 0 9-0 3YANGHuanhuan求的一种方案。首先需要对数据源进行梳理整合,将各类数据进行清洗、关联、存储,然后利用数据挖掘技术将基础数据加工为描述用户属性的标签,把这些标签互相融合归纳
9、,就能得到某一群体用户的整体特点,根据需求制定解决方案。2.1数据源梳理运营商在开展电信业务的同时,也产生了大量的经营分析数据、网络性能和信令数据等。这些数据包括用户基础信息、套餐信息、业务使用情况、网络设备性能指标、质量测试指标、业务运行日志、网络资源数据等。这些原始数据存储在不同的支撑系统中,且原始格式不统一,要使用这些数据,首先需要确定数据源格式,通过系统接口统一接入数据台,然后经过数据中台进行整合、清洗和存储后,形成可复用的标准化数据资产,统一对外提供一致的、高可用数据服务,支撑各类应用场景。本次梳理和整合的数据包括:通过业务运营支撑系统能够获取用户的性别、民族、所属地理区域等基础信息
10、,以及套餐和业务消费、亲情号关联情况等,例如套餐资费、流量语音使用情况、欠费缴费历史等,可用于分析用户的消费水平、通信偏好等;根据通话关系的统计数据、主副号关联关系等可用于分析用户的家庭成员关系及社交圈等;通过对移动网络的信令分析获取用户的常驻的基站位置、使用的终端信息等,使用DPI(深度包检测)技术解析网络流量可以获得用户的网络质量指标、上网内容类型等,用于网络质量评价。通过资源管理系统可以获取到网络资源的关联关系,用于对同一维度的网络设备指标进行聚类统计,生成可视化的网络质量拓扑图,Changjiang Information&Communications也已用于分析用户网络质量的瓶颈位置
11、。通过客户服务系统可以获取到用户的故障投诉、调查问卷等记录,可以对用户意见比较集中的位置和问题,利用大数据分析研判,优化业务流程及服务标准,提升用户满意度。2.2标签设计标签是用户画像的构成元素,是从多个视角对用户特征的描述信息。用户标签的设计依据业务需求和数据具备情况进行分层规划和维度划分,根据不同的算法生成,方法主要包括对基础数据进行直接抽取、规则判断或简单加工,也可针对特定场景运用统计学算法、机器学习算法建模分析。用户标签分为三层架构。一级标签为内容分类,例如基础信息、业务信息、终端信息等;二级标签依据关注的视角进行划分,一般是统一内容的进一度维度细分,例如行为偏好可分为通信、上网、接触
12、等偏好;三级标签则是具体的用户标签名称,描述用户的特定属性。如表1列举了部分标签的划分。表1用户标签维度划分一级标签二级标签基本信息基础属性入网信息信用积分业务信息套餐信息业务使用常用终端终端信息家庭终端通信行为上网行为行为偏好渠道接触位置信息客户体验服务感知网络感知网络质量用户标签体系并不是一次完成的,而是需要通过流程管理不断优化完善,对标签的创建、编辑、运行、应用、评估、版本管理、下线进行生命周期管理,根据业务需求更新用户标签,完善用户画像。2.3系统实现用户画像系统可分为数据层、画像层以及应用层。其中,数据层基于数据中台的功能完成,主要负责对各支撑系统的原始数据的采集、清理和存储,加工处
13、理后形成数据仓库。画像层主要处理客户的画像标签体系,通过算法将数据仓库中的基础数据计算成为用户画像的标签值,然后基于客户标签提供客户的分析以及挖掘功能。应用层读取画像系统的数据,然后将标签数据进行可视化展示,支撑各类应用场景的用户分群和数值统计。3画像应用实践3.1潜在换机用户预测终端营销一直都是运营商吸引新客户、绑定老客户、拓展运营边界的重要手段,尤其在网络技术迭代迅速的今天,手机等智慧终端成为互联网流量入口,推动用户进行终端更换也杨欢欢:基于多维大数据的用户画像构建及应用探究有利于新技术的普及和应用形态的发展,提升电信企业运营服务水平。用户更换手机终端的因素可能是因手机丢失、损坏等原因导致
14、,也可能是因为追求新型终端的功能、外观等原因,抑或是因手机性能导致的周期性换机3。机器学习模型主要针对这些有固定周期性更换终端行为的用户进行预测。潜在换机用户预测的模型思想是基于用户的消费信息、终端信息、行为偏好等用户标签的特征分析,利用XGBoost算法,得到能换机用户的特征标签及其重要性指标,使用这些特征标签来预测需要更换终端的用户。XGBoost是一种提升树模型的集成学习算法,其思想就是不断地进行特征分裂添加树,每添加一个树,就是学习一个新函数,去拟合上次预测的残差,当训练完成后会得到k棵树,最后根据样本特征,将每棵树对应的预测分数加起来就是样本的预测值。从全量用户数据中各抽取2 0%更
15、换5G终端的用户和未更换终端的用户作样本集,进行模型训练,模型经过多次迭代三级标签内容描述优化后,对未换机的用户进行预测,输出换机概率大于7 5%的用户,就是目标客户清单。性别、年龄、民族等另一方面,基于现有用户使用的终端类型,可分析出OPPO、归属地、入网时间等华为、VIVO品牌使用的人数最多,5G终端中OPPOA72、i Ph o n e 12、星级、积分信息等等vivoY52s(5G 版)等型号使用人数较多,年轻人更偏好OPPO、VIVO等。基于这些预测结果,市场营销部门可针对这些目标套餐费用、缴费信息、欠费信息等客户倾向5G终端品牌开展精准营销服务。是否开通宽带、IPTV等3.25G网
16、络引流常用终端品牌、型号、制式、在网时长等随着5G网络的规模覆盖,5G技术将进一步丰富消费场光猫型号、MAC地址等景、激发消费潜能,逐步实现引领需求、创造需求,但目前5G网络的整体利用率却不高,且部分地区存在4G、5G 网络覆盖基于语音信息、通话信息,分析通信行为偏好不平衡现象。流量使用、上网内容、上网时段等影响5G网络使用的因素有三个,一个是用户周围有5G根据业务办理渠道信息,分析接触偏好基站覆盖,第二是用户的终端需支持5G网络且开启5G功能。要提高5G网络使用率,一方面是利用潜在换机模型推动用户基于基站、信令,刻画日常通信位置轨迹更新终端;另一方面要引导用户使用5G网络。投诉信息、调查结果等根据用户的流量使用标签信息,有30%的5G终端用户并根据网络质量指标评价用户网络质量未使用5G网络,这部分用户若在5G覆盖范围内,就可以将其引导至5G网络下,提升5G流量占比。结合其终端信息、常驻无线小区、基站资源信息进行关联分析,判断用户常驻区是否有5G覆盖,生成是否5G覆盖用户的用户标签。将有5G覆盖的这些用户再根据语音、流量使用量,人均收入价值等标签进行排序,按有限次序推送给服务部门进行精