文章目录
  1. 1. 安装
  2. 2. 监控
    1. 2.1. 下载check_openmanage
    2. 2.2. 使用check_openmanage

各大厂商的服务器都有配到的硬件管理及监控软件,本文主要针对Dell服务器,讲解它的管理与监控。

Dell服务器的 OMSA (OpenManage Server Administrator )是安装在操作系统中的一套软件,提供硬件监控、驱动程序的升级等操作。

安装

  • 配置仓库
curl -s http://linux.dell.com/repo/hardware/dsu/bootstrap.cgi | bash
  • 安装DSU(Dell EMC System Update)

    DSU 是为操作更新驱动与软件的服务。

yum install dell-system-update
  • 安装并启动OMSA
yum install srvadmin-all -y

# 设置开机启动
/opt/dell/srvadmin/sbin/srvadmin-services.sh enable

# 启动服务
/opt/dell/srvadmin/sbin/srvadmin-services.sh start
Starting instsvcdrv (via systemctl): [ 确定 ]
Starting dataeng (via systemctl): [ 确定 ]
Starting dsm_om_connsvc (via systemctl): [ 确定 ]

监控

安装完OMSA后,可以通过访问 https://<本机IP>:000 通过浏览器的方式查看硬件信息,如果机器成百上千台,这种方式的工作效率是非常低的,因此本文介绍通过nagios插件 check_openmanage 的方式通过命令行检查,当然这个插件可以结合nagios和zabbix使用,有兴趣的同学可以深入学习一下。 下文只简单介绍使用方法

下载check_openmanage

wget http://folk.uio.no/trondham/software/files/check_openmanage-3.7.12.tar.gz

使用check_openmanage

./check_openmanage -h
Usage: check_openmanage [OPTION]...

GENERAL OPTIONS:

-f, --config Specify configuration file
-p, --perfdata Output performance data [default=no]
-t, --timeout Plugin timeout in seconds [default=30]
-c, --critical Custom temperature critical limits
-w, --warning Custom temperature warning limits
-F, --fahrenheit Use Fahrenheit as temperature unit
-d, --debug Debug output, reports everything
-h, --help Display this help text
-V, --version Display version info

SNMP OPTIONS:

-H, --hostname Hostname or IP (required for SNMP)
-C, --community SNMP community string [default=public]
-P, --protocol SNMP protocol version [default=2c]
--port SNMP port number [default=161]
-6, --ipv6 Use IPv6 instead of IPv4 [default=no]
--tcp Use TCP instead of UDP [default=no]

OUTPUT OPTIONS:

-i, --info Prefix any alerts with the service tag
-e, --extinfo Append system info to alerts
-s, --state Prefix alerts with alert state
-S, --short-state Prefix alerts with alert state abbreviated
-o, --okinfo Verbosity when check result is OK
-B, --show-blacklist Show blacklistings in OK output
-I, --htmlinfo HTML output with clickable links

CHECK CONTROL AND BLACKLISTING:

-a, --all Check everything, even log content
-b, --blacklist Blacklist missing and/or failed components
--only Only check a certain component or alert type
--check Fine-tune which components are checked
--no-storage Don't check storage
--vdisk-critical Make any alerts on virtual disks critical

For more information and advanced options, see the manual page or URL:
http://folk.uio.no/trondham/software/check_openmanage.html
文章目录
  1. 1. 安装
  2. 2. 监控
    1. 2.1. 下载check_openmanage
    2. 2.2. 使用check_openmanage