设备风扇状态 ****************** 获取交换机风扇的在线状态,供电状态等信息。 采集侧 ==================== 采集原理 ~~~~~~~~~ 采集器通过周期性地查询设备的风扇状态。 .. attention:: *设备风扇状态的获取OID需要手工指定,计划将此部分录入CMDB* .. attention:: *不同厂商的设备,同一厂商的设备获取到的信息是不大相同的。需要针对各个设备分别对待。* 采集任务参数配置要求 ~~~~~~~~~~~~~~~~~~~~~~~ .. list-table:: :widths: auto :stub-columns: 1 :align: left * - **采集方式** - SNMP * - **SNMP OID** - #. H3C: 1.3.6.1.4.1.25506.8.35.9.1.1.1.2 #. Huawei: 1.3.6.1.4.1.2011.5.25.31.1.1.10.1.7 #. Cisco_Nexus: 1.3.6.1.4.1.9.9.117.1.4.1.1 #. Cisco_Catalyst: 1.3.6.1.4.1.9.9.13.1.4.1.3 #. RuiJie: 1.3.6.1.4.1.4881.1.1.10.2.21.1.5.1.3.1 #. Juniper: 1.3.6.1.4.1.2636.3.1.13.1.6.4 * - **返回值** - #. H3C: 风扇状态值,返回值为1表示正常,其他表示异常 #. Huawei: 风扇状态值,返回值为1表示正常,其他表示异常 #. Cisco_Nexus: 风扇状态值,返回值为2表示正常,其他表示异常 #. Cisco_Catalyst: 风扇状态值,返回值为1表示正常,其他表示异常 #. RuiJie: 风扇状态值,返回值为4表示正常,其他表示异常 #. Juniper: 风扇状态值,返回值为2表示正常,其他表示异常 * - **采集超时时间** - 默认10000ms * - **采集周期** - 次/30min * - **配置筛选条件** - #. 业务线 #. 区域(地域) #. 机房 #. POD #. 业务属性(服务角色) #. 设备角色 #. 设备IP、IP地址段 * - **特殊要求** - #. 使用同一机房的采集去采集,如果该机房没有采集器,使用一组指定的默认采集器去采集 #. 支持手动指定某一些IP地址(ip地址段)使用特定的采集器 任务处理流程 ~~~~~~~~~~~~~~ a. 从筛选条件中筛选出符合要求的设备;设备优先使用带内IP地址作为目标地址去采集,如果没有带内地址,则使用带外去采集。 #. 将筛选出的设备,设置采集周期; #. 对上述设备执行下发任务至指定的采集节点(包括人工指定,和按同一个机房使用本机房的采集器两种方式,后一种为默认行为); #. 对于不能通过自动下发任务至同机房采集器的任务,下发任务至默认的采集器去采集; #. 采集器执行流量采集任务,当请求报文发出去之后。如果超时时间内(默认 10000ms)没有收到返回,认为设备没有返回。 #. 将返回值解析成index和风扇状态的关系 设备风扇状态snmp返回值解析 ~~~~~~~~~~~~~~~~~~~~~~~~~~ SNMP请求返回值为oid和状态的对应关系。需要从oid中截取部分为index。标记为设备风扇的index。对于超时没返回的,标记为本次数据缺失,不能设置成0值等。 .. list-table:: :widths: auto :stub-columns: 1 :align: left * - **H3C** - 截取最后一位为index。如:.1.3.6.1.4.1.25506.8.35.9.1.1.1.2. ``1`` = 1 * - **Huawei** - 截取后两位为index。如:.1.3.6.1.4.1.2011.5.25.31.1.1.10.1.7. ``283``. ``0`` = 1 * - **Cisco_Nexus** - 截取最后一位为index。如:.1.3.6.1.4.1.9.9.117.1.4.1.1.1. ``534`` = 2 * - **Cisco_Catalyst** - 截取最后一位为index。如:.1.3.6.1.4.1.9.9.13.1.4.1.3. ``1007`` = 1 * - **RuiJie** - 截取最后一位为index。如:.1.3.6.1.4.1.4881.1.1.10.2.21.1.5.1.3.1. ``1`` = 4 * - **Juniper** - 截取倒数第二位为index。如:.1.3.6.1.4.1.2636.3.1.13.1.6.4.1. ``1``.0 = 2 然后将风扇状态值转换为状态,正常或不正常。 设备风扇状态采集示例 ~~~~~~~~~~~~~~~~~~~~~~~~ 如下是一台Juniper系列交换机的风扇状态采集示例。“=”右边的2即为风扇正常。 .. code-block:: shell [linux ~]$ snmpbulkwalk -c 360buy -v 2c -O Qn 10.252.255.65 1.3.6.1.4.1.2636.3.1.13.1.6.4 .1.3.6.1.4.1.2636.3.1.13.1.6.4.1.1.0 = 2 .1.3.6.1.4.1.2636.3.1.13.1.6.4.1.2.0 = 2 .1.3.6.1.4.1.2636.3.1.13.1.6.4.1.3.0 = 2 .1.3.6.1.4.1.2636.3.1.13.1.6.4.1.4.0 = 2 .1.3.6.1.4.1.2636.3.1.13.1.6.4.1.5.0 = 2 数据染色 ~~~~~~~~~~~~~~~~ 对每条采集数据,染色如下。 a. 时间戳(采集时间) #. 业务线 #. 区域(地域) #. 机房 #. POD #. 房间 #. 机柜 #. 业务属性(服务角色) #. 设备角色 #. 带内管理IP #. 带外管理IP #. 设备名 #. 厂商 #. 设备品牌 #. 设备型号 #. 设备流程状态 #. 风扇index #. 风扇状态(正常或者不正常) #. 风扇状态值 可视化 ================== 针对单台设备,对一段时间内的所有风扇index的风扇状态。要求如下。 #. 以横坐标为时间轴,纵坐标为风扇状态。刻画设备每个风扇的CPU使用率,线条表示。 #. 默认展示一个小时的使用率信息; 报表 ================== 每天统计出一天内有风扇采集状态为不正常的设备清单(出现一次不正常就需要被统计)。包括如下信息。 #. 业务线 #. 区域(地域) #. 机房 #. POD #. 房间 #. 机柜 #. 业务属性(服务角色) #. 设备角色 #. 带内管理IP #. 带外管理IP #. 设备名 #. 厂商 #. 设备品牌 #. 设备型号 #. 设备流程状态 #. 风扇index #. 风扇状态(正常或者不正常) #. 风扇状态值 未完成的部分 ================== #. 自助任务下发; #. 策略的分级,即按类似ACL的方式匹配策略;需求未提 #. 可视化 #. 报表需求