当前位置:首页>>软件产品>>网络管理系统>>故障诊断及告警
 
 
- 故障诊断及告警-

告警管理

告警管理用于统一接收、采集系统中发生的各种异常情况,并通过对这些信息统一处理(标准化、压制、合并、过滤、故障源定位等)实现“全面监控、准确告警、及时通知、快速解决”的目的,告警管理在保证告警信息准确性的条件下,可通过各种外部接口(邮件、短信、语音)通知指定维护人员,对于较严重的、需要维护人员人工解决的告警信息,应通过服务支持部分自动生成工单,进入闭环处理流程,对于重大告警信息,应通过相应接口及时通报总部,告警管理是系统监控最核心的部分。

VISTA 的故障诊断与管理功能包括以下部分:故障诊断、故障自动恢复等。

故障诊断

当系统发生故障后,由于系统复杂―——几十台路由器、服务器,用户很难立刻根据表面现象判断出故障的真正原因,用户会根据经验一步一步地检查故障,如 ping 一下路由器、检查一下系统 CPU 使用率、内存使用率等。这样手工检查的缺点一是对网管人员要求高,普通网管很难胜任该工作,二是随意性强、没有规范,很容易漏掉一些关键点,三是效率低,网管人员一边思考、一边检查,耗时长,而网络瘫痪时间越长,企业的损失就越大。

针对此情况, VISTA 提供工具将此连锁诊断过程程序化,一旦系统出现异常, VISTA 将自动启动连锁诊断功能,实现零时定位故障,帮助用户快速查找故障根源。用户可以根据自己的经验对某个应用或某台设备定义好连续诊断的过程,一旦该应用或该设备运行异常, VISTA 将自动启动连锁诊断程序,对可能产生故障的原因逐一进行确认,直至找到故障根源。由于过程自动化,非常规范,不会漏掉一些关键步骤,使检查更准确,并且这个连锁诊断过程可逐步积累,形成知识库,即使是普通网管人员也可以轻松使用。流程诊断模块使故障诊断更加快捷、方便、准确。

故障自动恢复

VISTA 的故障自动恢复功能对运营维护人员具有非常重要的意义。当出现一个临时性的标准故障时,自动恢复功能就会执行脚本或 POST 数据到指定的 CGI 程序,使服务恢复正常。比如,把一个挂起的服务器操作通过自动启动功能而使它重新运行;把一个耗费系统过多资源的进程停止或者重新启动。

VISTA 故障自动恢复方式

功能详细说明

优势和好处

自动 POST 数据清除故障

对于可能经常出现的故障,运营维护人员可事先编译好 POST 数据,一旦满足了预先设定的条件,系统将自动发送 POST 数据到指定的 CGI 程序对故障进行自动处理

可实现远程的故障自动处理,从而确保系统全天候的正常运行

自动脚本执行恢复故障

当出现一个临时性的标准故障时,自动恢复功能就会执行脚本,使服务恢复正常。

及时快速解决故障问题,降低运营风险,减小损失,节约故障处理时间