设备风扇状态

获取交换机风扇的在线状态,供电状态等信息。

采集侧

采集原理

采集器通过周期性地查询设备的风扇状态。

注意

设备风扇状态的获取OID需要手工指定,计划将此部分录入CMDB

注意

不同厂商的设备,同一厂商的设备获取到的信息是不大相同的。需要针对各个设备分别对待。

采集任务参数配置要求

采集方式

SNMP

SNMP OID

  1. H3C: 1.3.6.1.4.1.25506.8.35.9.1.1.1.2

  2. Huawei: 1.3.6.1.4.1.2011.5.25.31.1.1.10.1.7

  3. Cisco_Nexus: 1.3.6.1.4.1.9.9.117.1.4.1.1

  4. Cisco_Catalyst: 1.3.6.1.4.1.9.9.13.1.4.1.3

  5. RuiJie: 1.3.6.1.4.1.4881.1.1.10.2.21.1.5.1.3.1

  6. Juniper: 1.3.6.1.4.1.2636.3.1.13.1.6.4

返回值

  1. H3C: 风扇状态值,返回值为1表示正常,其他表示异常

  2. Huawei: 风扇状态值,返回值为1表示正常,其他表示异常

  3. Cisco_Nexus: 风扇状态值,返回值为2表示正常,其他表示异常

  4. Cisco_Catalyst: 风扇状态值,返回值为1表示正常,其他表示异常

  5. RuiJie: 风扇状态值,返回值为4表示正常,其他表示异常

  6. Juniper: 风扇状态值,返回值为2表示正常,其他表示异常

采集超时时间

默认10000ms

采集周期

次/30min

配置筛选条件

  1. 业务线

  2. 区域(地域)

  3. 机房

  4. POD

  5. 业务属性(服务角色)

  6. 设备角色

  7. 设备IP、IP地址段

特殊要求

  1. 使用同一机房的采集去采集,如果该机房没有采集器,使用一组指定的默认采集器去采集

  2. 支持手动指定某一些IP地址(ip地址段)使用特定的采集器

任务处理流程

  1. 从筛选条件中筛选出符合要求的设备;设备优先使用带内IP地址作为目标地址去采集,如果没有带内地址,则使用带外去采集。

  2. 将筛选出的设备,设置采集周期;

  3. 对上述设备执行下发任务至指定的采集节点(包括人工指定,和按同一个机房使用本机房的采集器两种方式,后一种为默认行为);

  4. 对于不能通过自动下发任务至同机房采集器的任务,下发任务至默认的采集器去采集;

  5. 采集器执行流量采集任务,当请求报文发出去之后。如果超时时间内(默认 10000ms)没有收到返回,认为设备没有返回。

  6. 将返回值解析成index和风扇状态的关系

设备风扇状态snmp返回值解析

SNMP请求返回值为oid和状态的对应关系。需要从oid中截取部分为index。标记为设备风扇的index。对于超时没返回的,标记为本次数据缺失,不能设置成0值等。

H3C

截取最后一位为index。如:.1.3.6.1.4.1.25506.8.35.9.1.1.1.2. 1 = 1

Huawei

截取后两位为index。如:.1.3.6.1.4.1.2011.5.25.31.1.1.10.1.7. 283. 0 = 1

Cisco_Nexus

截取最后一位为index。如:.1.3.6.1.4.1.9.9.117.1.4.1.1.1. 534 = 2

Cisco_Catalyst

截取最后一位为index。如:.1.3.6.1.4.1.9.9.13.1.4.1.3. 1007 = 1

RuiJie

截取最后一位为index。如:.1.3.6.1.4.1.4881.1.1.10.2.21.1.5.1.3.1. 1 = 4

Juniper

截取倒数第二位为index。如:.1.3.6.1.4.1.2636.3.1.13.1.6.4.1. 1.0 = 2

然后将风扇状态值转换为状态,正常或不正常。

设备风扇状态采集示例

如下是一台Juniper系列交换机的风扇状态采集示例。“=”右边的2即为风扇正常。

[linux ~]$ snmpbulkwalk -c 360buy -v 2c -O Qn 10.252.255.65 1.3.6.1.4.1.2636.3.1.13.1.6.4
.1.3.6.1.4.1.2636.3.1.13.1.6.4.1.1.0 = 2
.1.3.6.1.4.1.2636.3.1.13.1.6.4.1.2.0 = 2
.1.3.6.1.4.1.2636.3.1.13.1.6.4.1.3.0 = 2
.1.3.6.1.4.1.2636.3.1.13.1.6.4.1.4.0 = 2
.1.3.6.1.4.1.2636.3.1.13.1.6.4.1.5.0 = 2

数据染色

对每条采集数据,染色如下。

  1. 时间戳(采集时间)

  2. 业务线

  3. 区域(地域)

  4. 机房

  5. POD

  6. 房间

  7. 机柜

  8. 业务属性(服务角色)

  9. 设备角色

  10. 带内管理IP

  11. 带外管理IP

  12. 设备名

  13. 厂商

  14. 设备品牌

  15. 设备型号

  16. 设备流程状态

  17. 风扇index

  18. 风扇状态(正常或者不正常)

  19. 风扇状态值

可视化

针对单台设备,对一段时间内的所有风扇index的风扇状态。要求如下。

  1. 以横坐标为时间轴,纵坐标为风扇状态。刻画设备每个风扇的CPU使用率,线条表示。

  2. 默认展示一个小时的使用率信息;

报表

每天统计出一天内有风扇采集状态为不正常的设备清单(出现一次不正常就需要被统计)。包括如下信息。

  1. 业务线

  2. 区域(地域)

  3. 机房

  4. POD

  5. 房间

  6. 机柜

  7. 业务属性(服务角色)

  8. 设备角色

  9. 带内管理IP

  10. 带外管理IP

  11. 设备名

  12. 厂商

  13. 设备品牌

  14. 设备型号

  15. 设备流程状态

  16. 风扇index

  17. 风扇状态(正常或者不正常)

  18. 风扇状态值

未完成的部分

  1. 自助任务下发;

  2. 策略的分级,即按类似ACL的方式匹配策略;需求未提

  3. 可视化

  4. 报表需求