内网排障工具¶
主机间链路图故障情况¶
当给定两个IP地址,绘制出两个IP之间所经过的交换机和链路。并分析一段时间内所经过的路径上是否存在故障或者其他异常。
任务处理流程¶
待定
判断异常所需要的数据和阈值¶
- |
检测方式 |
数据来源 |
触发条件 |
其他要求 |
---|---|---|---|---|
设备存活报警 |
检查链路上的设备在指定时间段内有无对应设备的探活报警 |
当前的报警接口 |
有无报警 |
需要记录报警次数 |
端口流量使用率偏高 |
检查链路上的设备的互联端口在指定时间段内有无端口流量超过75%的。 |
当前的端口流量接口 |
有无达到阈值 |
需要记录触发的端口和触发次数 |
端口CRC增涨量高 |
检查链路上的设备的互联端口在指定时间段内有无端口CRC增长量超过100。 |
当前的端口流量接口 |
有无达到阈值 |
需要计算增速和增长大小 |
端口状态异常 |
查找对应设备的日志信息,检查链路上的设备之间互联端口在指定时间内有无端口异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
需要记录端口名和对应端口触发次数 |
设备板卡异常 |
查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应板卡异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
|
设备主控板异常 |
查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应主控板异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
|
设备堆叠异常 |
查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应堆叠异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
|
BGP邻居异常 |
查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应BGP邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
记录触发的邻居地址和次数 |
ISIS邻居异常 |
查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应ISIS邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) |
设备日志 |
有无关键字 |
记录触发的邻居地址和次数 |
CPU使用率报警(当前尚未有报警) |
检查链路上的设备在指定时间段内有无对应设备的CPU使用率报警 |
当前的报警接口 |
有无报警 |
需要记录报警次数 |
内存使用率报警(当前尚未有报警) |
检查链路上的设备在指定时间段内有无对应设备的内存使用率报警 |
当前的报警接口 |
有无报警 |
需要记录报警次数 |