1、天津农村合作银行IT系统监控项目建设方案一、项目背景我行自2023年以来先后投产上线综合业务系统、现代化支付系统、银行卡业务系统、农信银清算系统、个贷系统、社保系统、财税关库行横向联网系统、支票圈存系统、指纹身份认证系统、国际结算系统、客户效劳系统等业务处理型计算机系统,以及为内部管理效劳的信贷分析系统、报表系统、反洗钱系统、非现场稽核系统、征信系统等管理型计算机系统,并且事后监督系统、贷记卡系统、财务管理系统、信贷管理系统、网上银行系统等项目正在建设过程中。随着我行的业务开展和信息化建设的不断深入,在主机系统、网络系统、操作系统、数据库和应用软件等IT系统的数量和类型将会不断增加,使我行信息
2、系统的管理维护工作日趋复杂,对信息系统的稳定性、可靠性提出新的更高的要求,同时,对信息系统的风险评估工作也日趋复杂化。目前我行IT系统有OS400操作系统主机7台,AIX操作系统主机12台,Windows server 操作系统主机27台,数据库包括Informix、Sybase、DB2,中间件包括MQ、CICS、TXDUE。由于设备数量众多,无法做到实时监控,只能采用运维人员每天3次手工查询错误日志的管理方式监控,这些手段操作复杂,技术要求高。由于缺乏统一的、直观的监控方法,加之人为因素的影响,对及时发现系统安全隐患和解决问题的时效性方面,都造成一定的时滞,给IT系统的安全稳健运行带来了极大
3、的风险。因此,如何更有效地利用现有的IT系统资源,建立高效、标准的一体化信息系统监控管理体系,保证系统可靠性,预防突发事件发生,查找系统性能瓶颈,提高系统运行效率和IT运维效劳水平,确保IT系统的稳定、安全运行是目前我行科技工作面临的问题和考验。我们认为,通过使用专业的监控和运维管理软件,对IT整体系统进行有效、实时监控与预警,及时发现IT系统的安全隐患,有助于解决IT系统存在的安全隐患和漏洞。二、项目建设目标项目将首先实现对IT根底设施包括主机的性能及可用性监控、数据库的性能及可用性监控、中间件的性能及可用性监控以及业务系统的性能及可用性监控,以此为根底建立IT效劳流程管理,借助业界领先的效
4、劳管理软件,根据我行的实际需求,并结合行业最正确实践,构建全面、标准、高效、稳定的IT运维管理平台。通过对监控数据的归集和分析,预先发现故障隐患,提前采取措施,变被动式管理为主动式管理,提高IT系统效劳管理水平。根据ITIL的原理,在充分分析我行科技工作现状和业界成熟运维管理技术的根底上,借鉴其他银行的成功经验,本着高起点、高标准、总体设计、分步实施的原那么,确定总体建设目标:1、建立集中的监控管理平台负责收集和处理来自系统中的各类告警信息,并进行告警信息的会聚和根源分析,帮助运维人员找出故障发生的原因,快速定位故障点;包含网络、主机、数据库及应用管理系统软硬件配置信息、系统性能指标、故障告警
5、和日志管理。2、统一监控管理界面和多样的告警方式通过美观、布局合理的图形化界面集中反映网络、系统、数据库和应用的实时状态,通过 短信、邮件以及页面等多种方式进行告警。3、开发丰富的数据报表分析系统结合上述的各项功能,系统能够根据工作需要产生标准格式报表,并能够按条件生成和调整各类报表,以满足IT系统管理及科技风险审计评估等多种需求。三、项目建设原那么为了使信息系统监控管理平台既适应当前我行的需求,又面向未来开展的需要,系统应采用 “一体化建设原那么,即统筹规划,统一建设的原那么,保证整个系统顺利连通,并高效、稳定地运行。在进行系统方案的设计中,将遵循以下原那么:l 实用性原那么监控系统体系框架
6、的设计将适应系统运行管理体制和人员的实际情况,满足现有的人工监控的内容要求,所建议的技术方案和提供的产品是成熟的,具备方便的人机界面、易于使用。l 可用性原那么监控管理软件的部署不应对原有的系统结构、安全策略等方面做较大修改和调整,对原有系统性能影响最小化,不能对生产系统自身的运行造成不良影响,不能干扰系统的正常运行;尽量少的占用消耗原系统的资源、网络资源,被监控效劳器的资源整体消耗不超过5%。l 集成性原那么提供一个集成统一的管理平台,能够将系统管理、数据库管理、中间件和网络通讯等系统,进行良好整合集成,统一平台。l 健壮性原那么监控管理软件具有较强的免维护能力,能够长时间稳定运行,自身维护
7、要求简单,具有快速恢复功能。l 开放性和扩展性原那么监控管理软件架构设计应遵循业界标准,并提供开放、灵活的信息交互及管理接口,实现灵活的数据交换功能;提供灵活的部署方式,在客户化、管理策略、事件关联、报警方式、报表生成、信息展示、管理流程等方面可以按实际需求进行定制,并支持用户的二次开发;监控管理软件具有较强的扩展性,能够在包括管理范围、管理功能、管理对象数量等方面提供灵活、多样的扩展能力;可以适应生产系统新业务、新技术的要求,适应于监控系统未来开展的需要,并能与其他基于业界标准的软件进行集成。l 展示形式多样性原那么监控管理软件能够对收集的数据进行分析处理,生成技术、管理维护等层面的相关报表
8、、视图等,根据不同级别用户的实际需求,提供灵活、多样的展示形式,并提供良好、易操作的自定义功能。四、监控项目功能与内容根据需求,我们认为集中监控平台建设应实现以下根本功能:1、 效劳器监控针对效劳器进行监控,实现对主机系统的根本信息的采集和运行状态的监控。对各类主机系统故障进行告警,并提供灵活的告警展示。提供阀值定义功能,可以根据实际情况对不同的主机系统进行不同的阀值定义;2、 数据库监控针对各系统中使用的各类数据库例如Sybase、Informix等进行监控。能够监视数据库关键状态和性能信息,掌握数据库进程运行状况,对关键事务进行分析;3、 中间件监控能够对Tuxedo、CICS和MQ中间件
9、进行监控4、 用户管理通过对用户界面的相应定义,可以对用户进行管理,让不同用户具有不同的权限和不同的用户界面。5、 报表管理建设覆盖所有故障和性能管理内容的统一的统计分析中文报表系统是本项目的建设重点之一,报表及统计模块应具备很好的扩展能力,统一在运维管理门户上进行展示,报表的生成和演示可由第三方工具完成。五、项目监控范围序号类型范围具体描述1主机监视7台AS400、12台AIX主机设备、windows效劳器27台监视效劳器性能参数指标、性能指标超限告警仅OS层面,不涉及应用2数据库监视DB2、Sybase、Informix数据库监视数据库性能参数指标、性能指标超限告警3中间件监视Tuxedo
10、、CICS和MQ监视中间件性能参数指标、性能指标超限告警4网络监视路由器、防火墙、交换机网络设备性能参数指标、性能指标超限告警5报表系统1套根据IT管理岗位和技术岗位具体需要,输出IT规划和运营所需的各类报表,例如周报、月报等。六、产品及厂商分析对于系统安全的监控主要可分为:硬件和操作系统层、数据库和中间件层、应用层三个层面。目前市场上成熟的系统监控产品还是很多的,主要有IBM Tivoli、BMC Performance Manager、HP OpenView、CA Unicenter以及netIQ APP manager等等。通过市场调查、前期技术交流和分析,我们认为能够满足我行需求的软件
11、分别为:IBM Tivoli、HP OpenView、BMC Performance Manager。这些产品技术成熟,实施案例多,不但能够实现对操作系统、数据库、中间件、应用数据实时数据采集进行集中监控,对采集数据进行分析,产生不同维度报表对系统整体分析提供依据。而且系统扩展性强,可以支持二次开发,为后续的应用系统的监控提供了保障。在这些系统中还提供了流程控制、安全管理等组件,为今后打造全面的、系统的IT管理效劳平台打下了根底。 七、系统设计构架本系统采用统一监控,集中展现的方式实现对设备的监控。监控效劳器通过部署在各监控对象上的引擎收集信息,通过报表效劳器进行过滤、加工、整理,通过统一门户
12、进行展现。 统一集中展现 监控效劳器 报表效劳器 。被监控对象八、项目建设方案随着业务的不断开展,IT建设也将不断开展,IT效劳管理的建设也会有一个不断开展完善的过程。所以,我们将项目的建设分为三期。l 一期主要完成系统级的监控,包括对主机、操作系统、数据库、中间件以及网络的监控。通过对这些设备的监控,及时有效的提前发现问题,防患于未然,减少技术故障对业务的影响。l 二期主要完成对应用级的监控,包括对综合业务系统、各类前置系统、各类管理分析系统等等。l 三期建成包括设备监控、应用监控、安全监控、流程管理在内的IT效劳管理平台,全面提升我行科技产品研发的效劳水平。九、项目一期建设周期及投资预算为了保证项目的质量,根据ITIL软件开发管理流程,此项目的建设周期约为3个月。本项目投资主要包括软件局部和硬件局部,其中软件局部包括监控软件平台及相应模块的使用费和实施费用,硬件局部主要包括系统监控效劳器,以及数据分析展示效劳器。