1、2023 年 2 月 25 日第 7 卷第 4 期现代信息科技Modern Information Technology Feb.2023 Vol.7 No.439392023.022023.02收稿日期:2022-09-21高铁客服系统的运维管理指挥平台开发研究程志刚,张天扬,马一人(苏州易维迅信息科技有限公司,江苏 苏州 215163)摘 要:针对当下高铁客服系统的运维工作以人工为主、设备庞杂、运维业务数据复杂等问题,文章以云计算、数据库、Web Service、运维设备业务数据为基础,研发一套数字化、信息化、系统化的运维管理指挥平台,以解决运维业务中存在的操作复杂、工序执行混乱、责任不明
2、确、海量数据汇总统计等问题,提升运维流程的可控性、可追溯性和安全性,实现运维业务的可视化、实时化和智能化,保障运维管理计划的顺利执行,优化系统操作体验,提高沟通和协作效率。该系统对打造安全、智能、高效、先进的日常运维管理指挥平台,实现智能铁路系统建设具有重要意义。关键词:高铁;客服系统;运维管理;智能系统中图分类号:TP315 文献标识码:A 文章编号:2096-4706(2023)04-0039-04Development and Research of Operation and Maintenance Management Command Platform of High-speed R
3、ailway Passenger Service SystemCHENG Zhigang,ZHANG Tianyang,MA Yiren(Suzhou EasyService Information Technology Co.,Ltd.,Suzhou 215163,China)Abstract:In view of the problems that the current operation and maintenance work of the high-speed railway passenger service system is mainly manual,the equipme
4、nt is complex,and the operation and maintenance business data is complex,this paper is based on cloud computing,database,Web Service,and operation and maintenance equipment business data to develop a digital,informatization,and systematic operation and maintenance management command platform to solv
5、e the problems of complex operation,disordered process execution,unclear responsibilities,and massive data summary and statistics in the operation and maintenance business,improve the controllability,traceability and security of the operation and maintenance process,realize the visual,real-time and
6、intelligent operation and maintenance business,ensure the smooth implementation of the operation and maintenance management plan,optimize the system operation experience,and improve the efficiency of communication and cooperation.The system is of great significance to build a safe,intelligent,effici
7、ent and advanced daily operation and maintenance management command platform and realize the construction of intelligent railway system.Keywords:high-speed railway;passenger service system;operation and maintenance management;intelligent system0 引 言作为世界第一高铁大国,我国高铁具有运营里程大、高铁站多、站点位置分布广的特点1。现有以人工为基础的管理
8、架构,运维人员要花大量时间去研究那些极少带有深层问题原因的告警事件,恢复设备故障是个很大的挑战2,3。因此,在高铁客服系统运维管理指挥平台设计中,如何基于现代高铁车站数字化、信息化、系统化、现代化的需求,通过先进成熟的网络技术、计算机信息技术、现代化通信技术结合实际,完成建设一套先进、成熟、可靠、开放、实用的高铁客服系统运维管理指挥系统,对实现我国智能高铁网建设具有重要意义4。1 运维管理指挥平台设计依据及原则高铁客服系统运维管理指挥平台是信息化建设的重要基础设施,必须从车站整体建设情况的全局考虑,将设备与运维管理建设为一个高可用,易于扩充、升级、管理和维护的DOI:10.19850/ki.2
9、096-4706.2023.04.010运营辅助系统。本系统平台的设计主要从系统设计先进性、系统设计可靠性和安全性、系统设计实时性,以及系统开放性与可扩展性共四个方面进行考虑。1.1 系统设计先进性高铁客服系统运维管理指挥平台既要从现实需要为出发点,又要考虑长远发展的需要,尽可能采取先进并且成熟的技术和产品,并要考虑潜在的扩充,使之在一定时期内保持较先进的水平。为了适应业务迅速增长的需要,系统性能不仅要适应现在的需要,还要满足未来几年的设备增长的要求。1.2 系统设计可靠性与安全性系统安全可靠运行是整个系统建设的基础。鉴于高铁客服系统运维管理指挥平台对业主工作的重要性,要求系统具备较高的可靠性
10、,系统自身应具备自我管理与自愈能力,要考虑关键设备的冗余,能够进行在线修复,更换和扩充5。要确保系统的正确性,数据传输的正确性,以及为防止异常情况所必需的保护性设施。1.3 系统设计实时性高铁客服系统运维管理指挥平台的主要业务是反映业主40402023.022023.02第 4 期现代信息科技工作环境中各类设施的运行状况,对状态的采集、分析、反馈速度等均有很高的要求。系统需要利用数据的特征将采集数据过滤、分析组合并传输给服务器,由服务器对采集的数据进行缓存,同时将数据过滤、分组合并成批,然后提交到数据库,并通知相应的工作人员和系统做出进一步处理。控制数据传输量的同时,确保信息的及时分析与通告。
11、1.4 系统开放性与可扩展性系统所采用的硬件平台、软件平台、网络协议等符合开放系统的标准,并能够与其他系统实现互联,要采用大多数厂商支持的国际标准协议。在总体设计中,采用开放式的体系结构,使网络易于扩充,使相对独立的分系统易于进行组合调整。有适应外界环境变化的能力,即在外界环境改变时,系统可以不作修改或仅做少量修改就能在新环境下运行。2 系统的基本架构本系统软件主要由三部分组成:数据采集层、业务管理层和应用层三部分组成,如图 1 所示,其具体功能如下。2.1 数据采集层采集层负责实时采集被监控对象的运行状态信息,分析处理原始数据,并发送到应用服务器层;数据采集方式主要有 SNMP、Telnet
12、、Syslog、ODBC/JDBC、Web Service 等方式;采集的信息包括数据中心、TSM、统一代办数据接口、虚拟机四大子系统的服务器主机设备、存储设备、数据库、虚拟机、应用软件等的关键运行状态参数;采集层由数据采集终端组成。数据采集终端采用模块化设计,对于不同的数据源可以加载不同的数据采集模块。2.2 业务管理层负责接收数据采集层发送的数据,进行阈值告警规则处理,并将所有数据存入数据库;通过与客户端的交互,将应用层订阅的信息发送到客户端;业务层部署在应用服务器软件内。2.3 应用层负责将应用服务器层发送的监控数据展示给用户界面;用户通过该用户界面进行设备运行状态监控与系统管理。从传统
13、的项目售后服务向基于服务水平管理和流程导向的运维服务管理转型,引入先进的运行维护服务理念和方法,建立并完善运维管理体系。自动化集中式采集现场设备的运行状态,对分布广袤区域的设备状态进行集中化、可视化展示,将设备问题及时展现给运维工作者,确保运维工作者及时发现设备的异常运转状态,及时采取措施将故障消灭在萌芽状态。平台对运维管理工作的过程进行统一规范化管理,由管理人员按照实际需要,定义运维计划与具体的运维业务内容。现场运维工作人员可以清晰地了解运维工作涉及哪些设备、每台设备包含的维护项目、要求完成的时间等信息。数据中心监控TSM监控Web服务监控虚拟机监控系统管理应用层数据访问报表引擎Web服务规
14、则引擎远程控制SDK开发包实时数据库历史数据库事件处理引擎业务层多路复用驱动采集层客户端核心服务驱动驱动驱动驱动SNMPODBCSyslogTrapWeb service 设备层图 1 高铁客服系统运维管理指挥系统架构图3 系统功能通过使用高铁客服系统运维管理指挥平台,能够为企业建立跨地域的设备管控中心,能够将不同地点的设备进行集中管理,将分布在不同地点的各类设备的状态信息收集,通过网络集中存放后,用户在管控中心便能够查看到不同地理位置的所有设备信息的运行信息,并能对设备进行远程管理、修复设备出现的问题6,7。有效利用高铁客服系统运维管理指挥平台的设备监控、故障告警、远程管理、数据挖掘、复杂事
15、件处理等功能,如图 2 所示,将为企业建立一套集中高效的运维管理体系。运维管理指挥平台系统总览复杂展示故障处理历史信息报表智能报表复杂事件处理告警规则管理资产管理系统配置设备详情故障告警基础报表日志分析数据挖掘设备管理拓扑管理用户管理图 2 系统功能结构图3.1 系统总览以统计数据、参数变化曲线、数据项、数据列表等方式,实时展现运维管理指挥平台中的各种参数及运行数据,如图3 所示,更加直观的了解设备及软件的运行状态。并可针对用户特定需求,根据系统自定义功能模块,提供不同的信息展示。41412023.022023.02第 4 期3.2 设备管理运维工作的开展是在设备的基础上进行的,设备管理,对与
16、运维工作相关的各类设备信息的维护,构成运维管理指挥平台的基础信息体系,为其他模块提供执行业务所需要基础数据。在设备管理功能模块中,对车站、站内区域、设备类型、厂家信息提供方便的管理,通过将这些信息进行组合,构建出完整的资产信息体系。3.3 设备详情展示设备详情展示是为了使运维指挥中心平台的用户从不同的角度,看到各铁路车站内设备的当前状态,提供易于使用的导航方式,方便用户查看到自己关心的设备,并能知晓设备的故障情况,从而进一步与其他功能模块联动,对故障进行处理。3.4 告警规则管理根据平台管理的设备类型不同,可以为每一类设备的运行状态设置阈值,形成告警规则。对应不同的阈值,对告警信息设置级别,不同的阈值对应不同的告警级别。阈值规则级别是根据参数重要性自定义设定,可以根据需求修改级别。通过适时调整修改阈值的设定,为系统的运行提供更严格的评估。3.5 故障告警按照对系统影响的严重程度,以及告警规则阈值设置的级别,将设备的告警信息分成不同的级别,用户也可以自定义告警级别。按照告警信息不同级别对告警信息进行统计计数,并且按照已解决、未解决、处理中对报警信息进行统计。为了让机房值班员及时发现系统中