设备 | Power Edge |
硬件配置信息 | |
机型号 | Power Edge R710 |
CPU | 4颗 Intel® Xeon® CPU E5520 @ 2.27GHz |
内存 | 16G |
硬盘 | 600G |
系统信息 | |
操作系统 | LINUX |
IP | |
主机名 |
检查项 | 检查操作 | 参考标准 | 巡检情况 | |
机柜或者机器上的防尘网 | 观察机柜以及机器上的防尘网上的灰尘 | 是否在防尘上堵塞导致气流不畅。 | ||
系统风扇运转检查 | 观察并用手感觉进风和出风是否正常 | 主机和磁盘柜的所有风扇运转正常。 | ||
系统运装噪音检查 | 仔细听系统运转声音 | 噪音是否过大,有无异常声音 | ||
系统电源指示灯检查 | 观察液晶面板、电源指示灯、硬盘报警灯等显示 | 液晶面板、电源指示灯、硬盘报警灯等显示情况正常 | ||
服务器硬盘工作状态 | 硬盘指示灯指示是否正常,一般绿色为正常 | 绿色闪烁 | ||
检查网线是否连接正常 | 检查网线与交换机之间的连线是否正常,以及双机心跳网线连接是否正常 | 交换机连接主机的所有端口指示灯为长亮,双机系统的公网与交换机之间的连接应为交叉连接。 | ||
服务器网卡工作状态 | 服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常 | 网卡指示灯正常闪烁 | ||
服务器散热检测 | 靠近服务器检查是否有热风吹出 | |||
服务器电源连接检查 | 电源连接线是否有松动、接触不良等情况 | |||
服务器外壳整体检查 | 服务器整体是否有移动或损害痕迹 | |||
服务器机房温度 | 机房的温度是否异常变动,温度数值多少 | 参考值温度:20℃-26℃ | ||
服务器机房湿度 | 机房的湿度是否异常变动,湿度计数值多少 | 参考值温度:45%-60% | ||
服务器机房静电防护 | 防静电地板是否损坏,防静电设备是否正常 | |||
服务器标签检查 | 标签是否松动、脱落,字体是否模糊不清 |
检查项 | 检查操作 | 参考标准 | 巡检情况 |
操作系统版本检查 | 执行命令uname –a | ||
系统账户检查 | 利用root身份、口令登陆 | 能够正常登陆到系统 | |
系统运行状态 | #uptime | 系统UP时间应该为上次重启导目前的时间 | |
检查项 | 检查操作 | 参考标准 | 巡检情况 |
检查各进程资源CPU占用率 | #top -c | CPU使用率小于80% | |
检查各进程资源内存占用率 | #top –c | 内存使用率小于80% | |
检查各进程资源内存交换区使用率 | #top –c | 内存交换区使用率小于80% | |
进出占用资源检查 | #top –c 进程名 | 察看系统最占资源的进程 察看具体某个进程占用资源的具体情况 | |
统计信息区
前五行是系统整体的统计信息。第一行是任务队列信息,同 uptime 命令的执行结果。其内容如下:
16:35:22 | 当前时间 | ||
up 17 day 5:45 | 系统运行时间,格式为时:分 | ||
4 user | 当前登录用户数 | ||
load average: 0.15, 0.15, 0.08 | 系统负载,即任务队列的平均长度。 三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 | ||
Tasks: 366 total | 进程总数 | ||
1 running | 正在运行的进程数 | ||
3 sleeping | 睡眠的进程数 | ||
0 stopped | 停止的进程数 | ||
1 zombie | 僵尸进程数 | ||
Cpu(s): 0.3% us | 用户空间占用CPU百分比 | ||
0.0% sy | 内核空间占用CPU百分比 | ||
0.0% ni | 用户进程空间内改变过优先级的进程占用CPU百分比 | ||
99.9% id | 空闲CPU百分比 | ||
0.0% wa | 等待输入输出的CPU时间百分比 | ||
0.0% hi | |||
0.0% si |
k total | 物理内存总量 |
k used | 使用的物理内存总量 |
63004k free | 空闲内存总量 |
377544k buffers | 用作内核缓存的内存量 |
k total | 交换区总量 |
320k used | 使用的交换区总量 |
k free | 空闲交换区总量 |
7835708k cached | 缓冲的交换区总量。 内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖, 该数值即为这些内容已存在于内存中的交换区的大小。 相应的内存再次被换出时可不必再对交换区写入。 |
USER 每个进程所有者的用户名。
PR 每个进程的优先级别。
NI 该进程的优先级值。
VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。单位是KB。
RES 该进程占用的物理内存的总数量,单位是KB。
SHR 该进程使用共享内存的数量。
S 该进程的状态。其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态。
CPU % 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。
MEM% 该进程占用的物理内存占总内存的百分比。
TIME+ 该进程自启动以来所占用的总CPU时间。如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。且标题会变成CTIME。
COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。内存中的进程会有一个完整的命令行。
(三)安全检查
检查项 | 检查操作 | 参考标准 | 巡检情况 | ||||||||
检查当前登陆用户 | #who | 除了管理员外没有其他用户登录 | |||||||||
文件系统占用率 | #df –ah | 没有文件系统超过80%的现象 | |||||||||
系统账户安全检查 | #more /etc/passwd #more /etc/shadow | 没有异常账户信息存在 | |||||||||
文件系统日志 | #dmesg | 无错误日志或错误日志不会影响系统的正常运行 | |||||||||
系统开放端口检查 | #netstat | 指显示出提供对于服务的端口,无关的端口一律关闭 | |||||||||
系统登陆情况检查 | #lastlog | 无异常账户或异常时间登陆 | |||||||||
显示登录在系统里的用户,检查他们正在做什么以及他们的处理器使用状况。属于常用的安全方面的命令。 | #w | ||||||||||
查看硬件配置:本地硬盘 | |||||||||||
(四)网络管理命令
检查项 | 检查操作 | 参考标准 | 巡检情况 | |
显示内核路由表 | #route –n | |||
主机连接系统网络情况 | ping命令 | 观察5分钟是否有丢包情况 | ||
主机网络配置情况 | 执行命令ifconfig –a | 端口应该UP,IP地址、子网掩码正确 | ||
服务器整体巡检结果 | ||||
巡检时间: | 巡检人: |