设备电源状态 ****************** 获取交换机电源的在线状态,供电状态等信息。 采集原理 ~~~~~~~~~ 采集器通过周期性地查询设备的电源状态。 .. attention:: *设备内存使用率的获取OID需要手工指定,计划将此部分录入CMDB* .. attention:: *不同厂商的设备,同一厂商的设备获取到的信息是不大相同的。需要针对各个设备分别对待。* .. attention:: *Huawei NE40系列路由器不支持该OID,不采集。华为CE5810 V1R3软件版本不支持,不采集* 采集任务参数配置要求 ~~~~~~~~~~~~~~~~~~~~~~~ .. list-table:: :widths: auto :stub-columns: 1 :align: left * - **采集方式** - SNMP * - **SNMP OID** - #. H3C: 1.3.6.1.4.1.25506.8.35.9.1.2.1.2 #. Huawei: 1.3.6.1.4.1.2011.5.25.31.1.1.18.1.6 #. Cisco_Nexus: 1.3.6.1.4.1.9.9.117.1.1.2.1.2 #. Cisco_Catalyst: 1.3.6.1.4.1.9.9.13.1.5.1.3 #. RuiJie: 1.3.6.1.4.1.4881.1.1.10.2.1.1.41.1.3.1 #. Juniper: 1.3.6.1.4.1.2636.3.1.13.1.6.2 * - **返回值** - #. H3C: 电源状态值,返回值为1表示正常,其他表示异常 #. Huawei: 电源状态值,返回值为1表示正常,其他表示异常 #. Cisco_Nexus: 电源状态值,返回值为2表示正常,其他表示异常 #. Cisco_Catalyst: 电源状态值,返回值为1表示正常,其他表示异常 #. RuiJie: 电源状态值,返回值为4表示正常,其他表示异常 #. Juniper: 电源状态值,返回值为2表示正常,其他表示异常 * - **采集超时时间** - 默认10000ms * - **采集周期** - 次/30min * - **配置筛选条件** - #. 区域(地域) #. 机房 #. POD #. 业务属性 #. 设备角色 #. 设备IP * - **特殊要求** - #. 使用同一机房的采集去采集 #. 支持手动指定某一些IP地址(ip地址段)使用特定的采集器 #. 支持对没有匹配上的任务进行默认任务配置 任务处理流程 ~~~~~~~~~~~~~~ a. 从筛选条件中筛选出符合要求的设备;设备优先使用带内IP地址作为目标地址去采集,如果没有带内地址,则使用带外去采集。 #. 将筛选出的设备,设置采集周期; #. 对上述设备执行下发任务至指定的采集节点(包括人工指定,和按同一个机房使用本机房的采集器两种方式,后一种为默认行为); #. 对于不能通过自动下发任务至同机房采集器的任务,下发任务至默认的采集器去采集; #. 采集器执行流量采集任务,当请求报文发出去之后。如果超时时间内(默认 10000ms)没有收到返回,认为设备没有返回。 #. 将返回值解析成index和电源状态的关系 设备电源状态snmp返回值解析 ~~~~~~~~~~~~~~~~~~~~~~~~~~ SNMP请求返回值为oid和状态的对应关系。需要从oid中截取部分为index。对于超时没返回的,标记为本次数据缺失,不能设置成0值等。 .. list-table:: :widths: auto :stub-columns: 1 :align: left * - **H3C** - 截取最后一位为index。如:.1.3.6.1.4.1.25506.8.35.9.1.2.1.2. ``1`` = 1 * - **Huawei** - 截取后二位为index。如:.1.3.6.1.4.1.2011.5.25.31.1.1.18.1.6. ``311``. ``0`` = 1 * - **Cisco_Nexus** - 截取最后一位为index。如:.1.3.6.1.4.1.9.9.117.1.1.2.1.2. ``470`` = 2 * - **Cisco_Catalyst** - 截取最后一位为index。如:.1.3.6.1.4.1.9.9.13.1.4.1.3. ``1007`` = 1 * - **RuiJie** - 截取最后一位为index。如:.1.3.6.1.4.1.4881.1.1.10.2.1.1.41.1.3.1. ``1`` = 4 * - **Juniper** - 截取倒数第二位为index。如:.1.3.6.1.4.1.2636.3.1.13.1.6.2.1. ``1``.0 = 2 然后将电源状态值转换为状态,正常或不正常。 设备电源状态采集示例 ~~~~~~~~~~~~~~~~~~~~~~~~ 如下是一台RUIJIE系列交换机的电源状态采集示例。“=”右边的4即为电源正常。“=”左边的最后一个数字即为电源的index。 .. code-block:: shell [linux ~]$ snmpwalk -c 360buy -v 2c -O Qn 10.196.4.224 1.3.6.1.4.1.4881.1.1.10.2.1.1.41.1.3 .1.3.6.1.4.1.4881.1.1.10.2.1.1.41.1.3.1.1 = 4 .1.3.6.1.4.1.4881.1.1.10.2.1.1.41.1.3.1.2 = 4 数据染色 ~~~~~~~~~~~~~~~~ 对每条采集数据,染色如下。 a. 时间戳(采集时间) #. 业务线 #. 区域(地域) #. 机房 #. POD #. 房间 #. 机柜 #. 业务属性(服务角色) #. 设备角色 #. 带内管理IP #. 带外管理IP #. 设备名 #. 厂商 #. 设备品牌 #. 设备型号 #. 设备流程状态 #. 电源index #. 电源状态(正常或者不正常) #. 电源状态值 可视化 ================== 针对单台设备,对一段时间内的所有电源index的电源状态。要求如下。 #. 以横坐标为时间轴,纵坐标为电源状态。刻画设备每个电源的CPU使用率,线条表示。 #. 默认展示一个小时的使用率信息; 报表 ================== 每天统计出一天内有电源采集状态为不正常的设备清单(出现一次不正常就需要被统计)。包括如下信息。 #. 业务线 #. 区域(地域) #. 机房 #. POD #. 房间 #. 机柜 #. 业务属性(服务角色) #. 设备角色 #. 带内管理IP #. 带外管理IP #. 设备名 #. 厂商 #. 设备品牌 #. 设备型号 #. 设备流程状态 #. 电源index #. 电源状态(正常或者不正常) #. 电源状态值 未完成的部分 ================== #. 自助任务下发; #. 策略的分级,即按类似ACL的方式匹配策略;需求未提 #. 可视化 #. 报表需求