内网排障工具

主机间链路图故障情况

当给定两个IP地址,绘制出两个IP之间所经过的交换机和链路。并分析一段时间内所经过的路径上是否存在故障或者其他异常。

任务处理流程

待定

判断异常所需要的数据和阈值

-

检测方式

数据来源

触发条件

其他要求

设备存活报警

检查链路上的设备在指定时间段内有无对应设备的探活报警

当前的报警接口

有无报警

需要记录报警次数

端口流量使用率偏高

检查链路上的设备的互联端口在指定时间段内有无端口流量超过75%的。

当前的端口流量接口

有无达到阈值

需要记录触发的端口和触发次数

端口CRC增涨量高

检查链路上的设备的互联端口在指定时间段内有无端口CRC增长量超过100。

当前的端口流量接口

有无达到阈值

需要计算增速和增长大小

端口状态异常

查找对应设备的日志信息,检查链路上的设备之间互联端口在指定时间内有无端口异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

需要记录端口名和对应端口触发次数

设备板卡异常

查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应板卡异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

设备主控板异常

查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应主控板异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

设备堆叠异常

查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应堆叠异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

BGP邻居异常

查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应BGP邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

记录触发的邻居地址和次数

ISIS邻居异常

查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应ISIS邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/

设备日志

有无关键字

记录触发的邻居地址和次数

CPU使用率报警(当前尚未有报警)

检查链路上的设备在指定时间段内有无对应设备的CPU使用率报警

当前的报警接口

有无报警

需要记录报警次数

内存使用率报警(当前尚未有报警)

检查链路上的设备在指定时间段内有无对应设备的内存使用率报警

当前的报警接口

有无报警

需要记录报警次数