利用主机监控系统实现服务器集中管理的研究和实践
【 摘 要 】 通过对主机监控系统的组成、设计、功能的研究,本文讨论了如何通过主机监控系统,管理人员能对运行各项电子政务业务系统的服务器进行集中管理,实时掌握运行情况,接收和处理报警信息,及时判断如关键业务的流量是否正常、应用运行是否超过规定阀值,保证电子政务核心业务稳定、高效、安全的运行。
【 关键词 】 主机监控;集中管理;数据采集
1 引言
目前,我国电子政务工作的重点已从大规模网络、安全、业务系统的建设阶段转向深化应用的阶段,很多省份均建立了的大量电子政务基础设施,如省市县三级电子政务网络设施,省市县及县镇级别的视频会议系统、以PKI技术为架构的CA证书认证中心、地市的RA中心、以及大量的政府门户网站等一系列基础设施。随着基础设施的逐步完善,电子政务工作的进一步开展,建设并投入运行了如网上信访、阳光政府四项制度(在线解答、听证、公示、通报)、政府信息公开、政务服务中心、在线访谈等大量深入政府业务流程的应用系统。
政府业务系统对网络设备、主机设备的依赖程度越来越高,一旦网络和业务系统出现故障,将直接影响到政府各部门正常的业务工作。如何实现对逐年增加的IT资源进行实时、集中监控,及时报警,保证核心业务稳定、高效、安全的运行,将日常运维服务经验形成知识库,优化IT运行维护流程,降低运维成本,及时掌握分散在各地的IT信息资产,已成为目前迫切需要解决的问题。
1 主机监控系统的设计
1.1 主机监控系统的逻辑设计
主机监控系统是对计算机及网络的各种事件及行为实时进行信息采集、监测、控制和审计的应用系统。对于网络设备和软硬件资源,主机监控系统应该能够集中高效的进行管理与维护,通过信息技术对IT资源运行情况进行实时的数据采集、分析和检测,对异常状况和网络故障能够及时告警,对应用系统和设备进行有效管理与维护,保障信息系统正常运行,并提供方便快捷的管理手段。
主机监控系统从业务逻辑来划分,主要由安装在客户端的数据采集部分、主机监控管理二个部分组成。
(1)数据采集端。通过安装在主机上的客户端软件,对硬件及应用系统的运行状况进行数据采集,并将采集的数据上传,提供给主机监控系统使用。
(2)主机监控代理端。通过对采集的数据进行统计、查询、分析,并根据设定的阀值,将报警信息显示和传递,进行及时处理。 主机代理端由两部分组成。
基本代理:指在计算机中安装的基本代理模块,负责基本信息的采集及发送、系统进程存活状态信息的发送。
策略代理:指根据计算机实际情况制定的策略生成的代理模块,它通过基本代理进行加载和卸载,并和基本代理协作,进行安全认证,保证代理端软件自身安全性。
(3)服务器控制管理端。通过安装在服务器的控制管理程序,收集汇总和分析客户端发送的采集信息,根据报警策略产生设备报警信息,并产生相应的审计报表等。
1.2 主机监控系统的静态建模
主机监控系统涉及的设备由于数量众多、种类繁杂,设备的各种状态和管理配置参数等更是不胜枚举,还需要存取设备运行过程中大量的历史数据进行性能趋势、故障关联分析。所以主机监控系统在设计上应使用关系型数据库为支撑。
在系统设计时,首先要进行静态建模。图2是依据主机监控系统的需求分析进行数据建模得出的实体-联系图(E-R图),提供了表示实体类型、属性和联系的方法,用来描述主机监控系统中的概念模型。依据E-R图在数据库中生成数据库对象,然后采用JPA技术,将数据库中的对象(表、视图、序列等)映射为Java对象,同时得到静态的类图。
实体-关系图中主要涉及的对象有:被监控服务器(用户名、主机名、操作系统、IP地址、CPU型号等);服务器的物理位置(机柜、所占用的空间)、设备信息(处理器、磁盘驱动器、端口、键盘、网络适配器、显卡等)、日志记录、应用进程等。
1.3 主机监控系统的动态建模
主机监控系统的静态建模完成后,开始进行系统的动态建模设计。动态模型描述监控系统的功能是如何完成的,用时序图、活动图、状态图和协作图等从不同角度来描述对象和对象之间的交互。
图3给出了主机监控系统中的时序图,描述了从监控面板进行监控任务下达、监控参数配置,通过监控管理、监控任务、管理配置EJB组件的调用,通过在监控代理运行Timer定时组件或接受SNMP trap,对SYSlog服务器日志进行分析,产生alarm MSG,最终在监控面板对被监控设备的状态、告警、性能趋势等进行展示。通过所采集到的数据,进而可以进行故障管理、流量管理、性能管理、主机管理、应用管理、安全管理、报表管理。
根据以上设计,主机监控系统的具体实现,主要由六个具体业务逻辑构成:(1)运行Web、EJB容器的Weblogic或JBoss中间件服务器;(2)数据系统;(3)SYSlog服务器;(4)运行代理或智能代理的被监控主机;(5)具有SNMP、SNMP trap功能的网络、安全等设备;(6)可以运行浏览器的PC终端或手持终端等。
1.4 主机监控系统的功能设计
主机监控系统应具有数据采集和分析、报警、系统管理等功能。
1.4.1数据采集和分析
数据采集和分析是指对监控主机的环境信息、软、硬信息及操作、使用行为进行数据采集和分析,具体包括几个方面。
(1)基本信息数据采集和分析:主要是计算机操作系统的基本配置数据,如用户名、主机名、操作系统、MAC地址、CPU型号等。
(2)软件信息数据采集和分析:采集该系统已经安装的软件信息。
设备信息数据采集和分析:采集该计算机的设备配置情况,包括处理器、磁盘驱动器、端口、键盘、网络适配器、显卡等。
(3)日志信息数据采集和分析:对系统生成的日志信息进行数据采集,其中包括英语程序错误记录、安全审核记录、系统错误记录等。
(4)应用/进程信息数据采集和分析:对系统的应用程序和进程的启动及运行情况进行数据采集,包括计算机名、IP地址、用户名、进程ID、程序名称等。
(5)网络行为数据采集和分析:对用户的上网行为进行数据采集,包括计算机名(IP地址)、用户名、上网时间、网址名等信息。
(6)非法外联行为数据采集和分析:进入办公网的计算机是经过严格审批手续的,对于没有进行审批就进入网络的计算机认为是非法内联行为,对计算机非法外联行为的数据采集包括计算机名(IP地址)、用户名、时间等信息。
1.4.2报警策略设定及实现
代理端报警策略的设置及事件的报警基本由服务器控制端负责管理,管理员根据应用系统的不同要求,产生相应的报警策略,代理端根据本级的报警策略对违规事件产生相应的报警信息,并立即上传至服务器控制端。
1.4.3系统管理功能
系统管理功能主要指系统本身的系统设置和维护功能,保证系统访问的用户安全性、系统登录和注销的合法性、系统配置的合理性、系统数据的安全备份与恢复、系统本身的操作日志记录的完整性。
2 主机监控系统在云南省电子政务运维管理中的具体应用
云南省电子政务运维管理充分利用主机监控系统,在政务网络的各区域部署数据采集客户端,如Web服务器、文件服务器、电子邮件服务器、数据库服务器,各政务业务系统等。通过主机监控,使得管理员有效掌握其运行情况,及时收到和处理报警信息,具体应用如图4所示。
通过主机监控系统,云南省电子政务解决了电子政务网络管理中大量的实际问题。
(1)拓扑管理 进行物理设备拓扑结构自动发现、物理拓扑管理与分区域分层次展示。主机监控系统自动搜索网络,发现网络节点如网络设备、服务器、PC主机、业务应用、VLAN等。当某地、某部门网络发生异常时,管理员可以打开拓扑图进行查找,为及时查处故障点提供直观的帮助。
(2)配置管理 定期备份关键网络设备的配置信息,展示网络设备配置情况,实现设备配置统一管理。
(3)资产管理 统计网络中的所有IT资源,包括:子网、IP、MAC、端口、链路、Vlan、资产变更等,让电子政务管理人员对自己的家底真正做到心里有数。
(4)故障管理 监测网络故障,实现告警相关性分析,快速故障定位。当有异常情况或征兆时能够及时给管理员提示,管理员可以根据故障严重程度合理安排运维计划。
(5)流量管理 进行流量分析,发现网络性能瓶颈,优化网络结构,提升网络性能,可以及时查找出到底是谁占用了大量有限而宝贵的网络资源。
(6)性能管理 主机检测系统通过各种监测手段收集网络内各种资源的运行状态,分析其性能指标,告知管理员目前哪些资源性能压力过大,哪些空闲。管理员根据这些性能信息合理的优化网络或规划网络扩容。
(7)主机管理 监测主机的CPU、磁盘、内存、进程、安装程序、流量、通断状态、网络延时等信息。管理员可以通过这些信息及时了解关键服务器的健康状态。
(8)应用管理 针对数据库、Web服务、邮件服务、中间件、应用服务等进行健康。这些应用往往被关键业务系统所使用,他们的健康状态直接威胁到业务系统的运行状态。
(9)安全管理 主机监控系统管理网络的所有资源,它的安全性直接与企业网安全级别挂钩,主机监控系统支持分区域分层次的管理模式。
(10)报表管理 主机监控系统提供大量的日常监测、故障、性能和分析数据,提供给电子政务管理人员掌握分析。
3 结束语
通过主机监控系统,电子政务技术管理人员可以有效保证核心业务稳定、高效、安全的运行,可以及时判断关键业务的流量是否正常、应用运行是否超过规定阀值,能够有效的进行系统日常监测、故障分析、性能优化和数据分析,进一步优化IT运行维护流程,降低运维管理成本,提高电子政务运维能力。
评论