内网排障工具 #################################### 主机间链路图故障情况 ==================== 当给定两个IP地址,绘制出两个IP之间所经过的交换机和链路。并分析一段时间内所经过的路径上是否存在故障或者其他异常。 任务处理流程 ~~~~~~~~~~~~~~~~~ 待定 判断异常所需要的数据和阈值 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ .. list-table:: :widths: auto :stub-columns: 1 :align: left * - **-** - **检测方式** - **数据来源** - **触发条件** - **其他要求** * - **设备存活报警** - 检查链路上的设备在指定时间段内有无对应设备的探活报警 - 当前的报警接口 - 有无报警 - 需要记录报警次数 * - **端口流量使用率偏高** - 检查链路上的设备的互联端口在指定时间段内有无端口流量超过75%的。 - 当前的端口流量接口 - 有无达到阈值 - 需要记录触发的端口和触发次数 * - **端口CRC增涨量高** - 检查链路上的设备的互联端口在指定时间段内有无端口CRC增长量超过100。 - 当前的端口流量接口 - 有无达到阈值 - 需要计算增速和增长大小 * - **端口状态异常** - 查找对应设备的日志信息,检查链路上的设备之间互联端口在指定时间内有无端口异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - 需要记录端口名和对应端口触发次数 * - **设备板卡异常** - 查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应板卡异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - * - **设备主控板异常** - 查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应主控板异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - * - **设备堆叠异常** - 查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应堆叠异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - * - **BGP邻居异常** - 查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应BGP邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - 记录触发的邻居地址和次数 * - **ISIS邻居异常** - 查找对应设备的日志信息,检查链路上的设备在指定时间段内有无对应ISIS邻居异常关键字。匹配关键字和报警策略一致。(http://idc.jd.com/argus/sys_log_exception/) - 设备日志 - 有无关键字 - 记录触发的邻居地址和次数 * - **CPU使用率报警(当前尚未有报警)** - 检查链路上的设备在指定时间段内有无对应设备的CPU使用率报警 - 当前的报警接口 - 有无报警 - 需要记录报警次数 * - **内存使用率报警(当前尚未有报警)** - 检查链路上的设备在指定时间段内有无对应设备的内存使用率报警 - 当前的报警接口 - 有无报警 - 需要记录报警次数