1、dianzi yuanqijian yu xinxijishu 电 子 元 器 件 与 信 息 技 术192|基于用户需求和生产需求的互联网 电视故障码平台架构设计贾煦,李茜,孟建瑶中国移动通信集团山西有限公司,山西太原,310000摘要:截至2022年8月,全国IPTV总用户数已达到3.61亿户,2021年全年累计增长0.26亿户。IPTV用户增量触顶趋势愈发明显。近几年,行业围绕IPTV下半场走向进行诸多探索,垂直业务、下沉市场、智慧服务等已成为行业发展的关键词。尽管产业链各方都在试图打开IPTV新价值大门,但新兴业态和商业价值离预期仍相差较远,有待深入挖掘。面对海量的存量用户,如何进一步
2、提升互联网电视的运维能力、降低运维成本将成为众多商家的首要考虑。本文将通过研究业内互联网电视故障码的实际情况,通过建设基于运维需求的互联网电视故障码平台,实现赋能用户、降本增效,提升用户满意度。关键词:互联网电视;故障码;5G消息中图分类号:G220.7文献标志码:ADOI:10.19772/ki.2096-4455.2023.1.044 0引言随着数字技术的发展,家庭场景、社区场景的智能化已经成为不可逆的趋势。而作为家庭显示中心的电视大屏,则是最具价值的载体之一。因此,以IPTV为代表的电视大屏业务势必将发挥越来越重要的作用。1背景介绍近几年,随着IPTV的智慧化、融合化、价值化转型,它也更
3、多地承担起智慧家庭核心枢纽、综合信息服务平台等角色。而根据工信部数据,截至2022年8月底,IPTV总用户数已达3.61亿户,巨大的用户规模进一步给IPTV在数字生活快速发展的过程中带来了更多可能。但是,互联网电视众多商家在推动互联网电视产业发展的同时,也给平时的故障处理带来一些困难。首先,互联网电视故障码杂乱无章,无统一标准。当故障发生时,各个环节均上报故障,需要人为筛选有用信息,为故障排查增加难度;其次,不同厂家针对同一故障现象上报不同故障码,对故障解析也是一种挑战,增加集中故障平台对接的难度;最后,基于现有的故障现象及范围,无法给出及时的预警,故障态势进一步扩大。目前国内针对互联网电视业
4、务质量检测,也有了一些研究,例如文献1基于互联网电视业务的全流程端到端管理体系研究,建设互联网电视全流程监控体系,并且建立基于业务流程的投诉、告警关联及预处理机制,但是针对故障代码不统一,仍没有有效的解决方案;文献2提出一种家庭宽带互联网电视端到端故障定界系统,系统以互联网电视盒子中的视频出现“卡顿”作为互联网电视端到端问题分析的突破点,但是无法对故障范围及现象做出及时预警;文献3通过在互联网电视业务运维工作中结合端到端业务资作者简介:贾煦,男,汉族,山西吕梁,本科,中级工程师,研究方向:互联网电视、家庭宽带;李茜,女,汉族,山西临汾,硕士,中级工程师,研究方向:信息安全、家庭宽带、互联网电视
5、;孟建瑶,女,汉族,山西朔州,硕士,研究方向:数据挖掘、内容网络。电 子 元 器 件 与 信 息 技 术|193网络与信息安全源数据、设备故障告警、业务性能指标,采用质差定界、关联定位、主动验证三级运维步骤,实现了互联网电视端到端的运维支撑,但是在终端断网情况下,不能将现网实际情况上传至平台,该方法未能做出及时的故障提示;文献4尝试对互联网电视的端到端业务进行研究,旨在提高端到端的质量,提升互联网电视的业务分析、告警监控、故障定位等方面的能力,仍未解决故障码不统一给平台侧带来的压力。鉴于此,本文提出基于用户感知与生产需求的互联网电视故障采集方法,主要有以下四方面的贡献。结合机顶盒故障码、EPG
6、弹出故障码、业务平台故障码三大类故障码来源信息,并走访装维、用户等,对多来源故障码规范化,分析整理得出互联网电视故障码字典,从而解决故障码来源多又互不相通的问题。根据故障码对应故障实际情况,将故障码划分为白码、黑码和灰码三大类,白码为用户端可看到的故障码,如用户欠费、用户网线连接错误类故障;黑码为用户端无法看到的故障码,如后台CDN频繁调度资源等导致的用户偶尔卡顿等;灰码为装维上门后,需要处理故障或者是优化指标时,通过后台设置可打开、在大屏端可看到的一类故障码,对众多故障码进行归一化处理,破除故障排查过程中的壁垒。通过与互联网电视中间件对接,搭建分析采集平台,实时进行故障收集与分析,帮助平台侧
7、维护人员快速掌握现网互联网电视用户情况,也能聚类发现端到端流程中的显性及隐性问题点,从而优化端到端环节。结合5G消息,解决机顶盒断网情况下,故障码无法上传的问题,推动整体网络品质提升,提升互联网电视用户的满意度。2总体架构本文提出了一种基于用户感知与生产需求的互联网电视故障采集方法,总体架构包括样本采集、离散分析、故障码归类、平台建设与对接,如图1所示。图 1基于用户感知与生产需求的互联网电视 故障采集方法整体架构2.1样本采集主动向互联网电视维护管理人员、现网装维人员及用户进行现网故障类型及故障代码的收集,为后续模型训练、平台搭建提供数据支撑。2.2离散分析由于没有专家的研判,样本收集的结果
8、比较笼统,不能直接运用于后续系统搭建。因此,对样本采集结果进行离散化,离散结果如表1所示。2.3故障码归类针对故障码来源不一、杂乱无章的问题,基于上一步离散化分析的结果,对故障码进行归类处理,根据故障码实际原因及面向展示人群,将故障码划分为白码、黑码和灰码三大类,如表2所示。表 1故障码离散化统计表故障码故障原因解决方案1XXXX零配件类确保用户可进入 EPG 界面2XXXX用户订购类用户订购与用户权益不一致3XXXX牌照方类牌照方 EPG 侧故障4XXXX业务鉴权类用户基础业务及增值业务鉴权情况5XXXX业务播放质量类用户在播放过程中的质量情况故障dianzi yuanqijian yu x
9、inxijishu 电 子 元 器 件 与 信 息 技 术194|2.4平台建设与对接本文的平台建设基于相关接口协议,用以规范故障码采集机和底层机顶盒的对接与实现,保证应用层各种报表及故障分析数据来源的正确性,协助平台管理人员、装维人员及普通用户快速排障,如图2所示。图 2平台逻辑整体架构3功能架构本文通过统一故障码APK应用、故障码广播消息及故障码统计消息三种机制,实现故障码的收集及统一。通过数据库统一处理,提供各种实时报表及故障分析。除此之外,根据“黑白灰”原则,将标准化的故障码信息开放给不同的人群,并通过5G消息,实现大小屏互动,为故障处理提供另一种支撑手段5。3.1统一故障码APK应用
10、机制互联网电视机顶盒在适配入网中,已统一全量预置统一故障码APK至机顶盒的ROM包中,具体规则如表3所示。表 3统一故障码 APK文件名SXYD-iPanelErrorRemind-ALL-release-210106.001.apk包名com.android.ipanel.errorpage预置目录/system/app 目录文件权限644是否自启动开机自启动统一故障码APK预置在系统中开机自启动后,会每3600秒发送一次心跳消息至相关管控平台。周期性心跳请求消息消息方向:机顶盒IPTV业务故障码采集机周期性心跳响应消息消息方向:IPTV业务故障码采集机机顶盒3.2统一故障码广播消息机制消息
11、方向:机顶盒广播消息统一故障码APK基本原理:机顶盒相关应用出现异常后,发出广播消息,同时携带相关错误信息,统一故障码APK应用监听广播,通过intent.getExtra方法获取相关事件的参数。统一故障码APK应用收到广播后显示错误码提示框,显示对应错误信息,生成规则如图3所示。图 3统一故障码广播消息机制表 2故障码归类表序号故障码类型解释1白码用户端可见;主要为用户或者接入层问题2黑码专业运维人员可见;主要为内容资源等问题3灰码装维人员可见;主要为可通过管控类的故障,配合装维人员实地处理 电 子 元 器 件 与 信 息 技 术|195网络与信息安全3.3统一故障码统计消息机制当机顶盒端有
12、故障发生时,机顶盒统一故障APK应用捕获到故障码后,会在第一时间向IPTV业务故障码采集机发送故障码相关消息,整体流程描述如下:故障码发送请求消息方向:机顶盒或小屏端IPTV业务故障码采集机故障码请求响应消息方向:IPTV业务故障码采集机机顶盒异常情况处理当机顶盒处于断网或者是IPTV业务故障码采集机故障情况下,会导致故障码无法记录。统一故障码APK将根据故障码请求响应消息体中响应状态码或者是无响应消息,自动将最近的5次故障情况进行盒端记录,当可正常上报时,统一故障码APK会将记录下来的故障情况按照故障码发送的消息格式进行补报6。同时,大屏端会同步展示故障二维码,手机终端扫描二维码,将故障码同
13、步至平台,手机终端通过5G消息展示排障方法,若是接入侧问题,用户可根据提示自助排障,大大缩短了故障时间。装维及维护人员也可使用5G消息查看故障用户上行网络侧状态,如接入侧是否弱光、BRAS工作状态等,为排障提供有力支撑。故障码展示示例效果如图4所示。图 4统一故障码示例图3.45G消息机制短信全面升级,实现了短信的互联网化,支持收发图片、影片、标清、定位等富媒体,无需下载APP,短信入口即生活入口,汇聚吃穿住行乐服务,用户可通过手机一键开机。本次故障码支持5G消息,采用全新的MaaP消息形态,通过Chatbot智能化服务,实现应用与个人交互,在消息窗口完成搜索、发现、订阅、支付等业务体验7。4
14、实验结果本文以某省现网互联网电视故障数据为基础,进行模型搭建及训练,所有实验都在IPTV故障码分析工作台上运行,利用混淆矩阵进行分析,数据集的详细信息如表4所示。表 4互联网电视故障数据序号故障码类型收集数据量 有效数据量(数据清洗后)1白码1000085002黑码1000092003灰码100008900本文采用分类准确率(Acc)对本方法的预测准确率进行评价:其中,ak是第k个类别中预测结果与实际结果一致的个数。表5给出了实验结果的预测准确率。表 5实验结果预测故障码类型模拟准确率白码98.97%黑码99.69%灰码98.83%5结语本文弥补了现有的互联网电视故障码来源多、杂乱无章,故障发
15、生时无统一指导方案,不能及时介入的现状。第一,本文对现网故障码进行统一归类整理,指导现网互联网电视故障处理。第二,基于规范化后的故障码数据,建立模型,实时输出报表,对平台侧、机顶盒侧、EPG侧的故障进行实时分析,对现网故障进行及时干预。第三,基于现网数据对模型不断训练,对故(下转第199页)电 子 元 器 件 与 信 息 技 术|199网络与信息安全5结论由上述可知,20172021年枣庄市“12121”年拨打量总体上呈下降的趋势;2017年到2018年呈上升趋势,但是从2018年至2021年“12121”用户拨打量明显下降。枣庄市夏季拨打量最多,春季次之,冬季较少,秋季最少。为了增加大家对“
16、12121”的关注度、提高拨打量,气象部门需要不断提高“12121”气象信息的准确率和及时性。面对新媒体的强势冲击,“12121”要不断优化资源配置,开拓创新,优化信箱内容,适时开展农业特色气象服务,特别要抓住庞大的农村市场,为农民提供更加实用的气象服务信息,提升农村抵御气象灾害的能力,确保农业安全生产。此外,仍需加大宣传推广力度,持续提升枣庄市气象局“12121”的影响力,进一步提升气象服务效果,推动枣庄气象事业高质量发展。参考文献1 刘荃,邓东杰,龚羡萍,等.气象声讯平台系统升级及业务发展浅析C.第34届中国气象学会年会S11创新驱动智慧气象服务第七届气象服务发展论坛论文集,2017.2 刘敏,刘春红,郭芳,等.聊城市12121声讯气象服务影响因子分析及服务策略J.山东气象,2010,30(12):26-27.3 张燕,刘丽,魏邦宪.陇南市“12121”现状及拨打量分析J.中国科技信息,2018(6):40-41+43.(上接第195页)障发生区域、节点、类型等进行预测,预防故障扩大化。第四,大小屏互动,即使在机顶盒断网的情况下,平台侧也可实时上传手机故障码,并通过5G消息协助用户