系统资源与性能
CPU
基本概念
中央处理器(Central Processing Unit,简称CPU)是计算机的主要设备之一,其功能是解释计算机指令以及处理计算机软件中的数据。
- 物理核:可以真实看到的CPU核,有独立的电路元件以及L1、L2缓存,可以独立地执行指令。一个CPU可以有多个物理核。
- 逻辑核:在同一个物理核内,逻辑层面上存在的核。一般一个物理核对应一个线程,但是如果开启了超线程,当超线程数量为n时,一个物理核可以分成n个逻辑核。 可以通过lscpu命令查看服务器中有多少个CPU,每个CPU中有几个物理核,以及每个CPU有几个逻辑核。
定界定位思路
常用CPU性能分析工具
- uptime:可用于打印系统平均负载,通过查看最后三个数字表示系统在过去1分钟、5分钟和15分钟内的平均负载情况,可以判断平均负载的变化趋势。 平均负载大于CPU数量时表示CPU不足以服务线程,部分线程在等待;平均负载小于CPU数量,代表当前还有余量。
- vmstat:可以动态地了解系统资源的使用情况,以及查看系统中是哪一个环节最占用系统资源。 通过vmstat -h命令可以查看命令详解参数。 例如:
#使用vmstat进行监测,每隔1秒刷新一次
vmstat 1
在命令的输出信息中,各字段所代表的含义如下:
字段 | 含义 |
---|---|
procs | 进程信息字段。 |
memory | 内存信息字段。 |
swap | 交换分区信息字段。 |
io | 磁盘读/写信息字段。 |
system | 系统信息字段。 |
cpu | CPU信息字段-us:非内核进程消耗 CPU 运算时间的百分比。-sy:内核进程消耗 CPU 运算时间的百分比。-id:空闲。-wa:等待 I/O 所消耗的 CPU 百分比。-st:被虚拟机所盗用的 CPU 百分比。 |
- sar:可用于分析系统性能,可以用来观察当前的活动以及配置,用以归档和报告历史统计信息。 例如:
# 安装sysstat
yum install -y sysstat
# 查看系统CPU的整体负载情况,每3秒统计一次,共统计5次
sar -u 3 5
在命令的输出信息中,各字段所代表的含义如下:
字段 | 含义 |
---|---|
%user | 用户模式下消耗的 CPU 时间的比例。 |
%nice | 通过 nice 改变了进程调度优先级的进程,在用户模式下消耗的 CPU 时间的比例。 |
%system | 系统模式下消耗的 CPU 时间的比例。 |
%iowait | CPU 等待磁盘 I/O 导致空闲状态消耗的时间比例。 |
%steal | 利用操作系统等虚拟化技术,等待其他虚拟CPU计算占用的时间比例。 |
%idle | CPU空闲时间比例。 |
- ps:可用于查看正在运行的进程。
# 查看系统中所有的进程,以及查看进程的父进程的 PID 和进程优先级
ps -le
# 查看当前shell产生的进程
ps -l
- top:可以动态地持续监听进程的运行状态,显示最消耗CPU的进程。
top
内存
基本概念
内存是计算机的重要组成部件,用于暂时存放CPU中的运算数据,以及与硬件等外部存储器交换的数据。特别地,非统一内存访问架构(non-uniform memory access,简称NUMA)是一种为多处理器的电脑设计的内存架构,内存访问时间取决于内存相对于处理器的位置。在NUMA下,处理器访问本地内存的速度比非本地内存速度(内存位于另一个处理器,或者是处理器之间共享的内存)快。
定位定界思路
常用内存分析工具/方式
- free:可用于显示系统内存状态。 例如:
# 显示系统内存状态,以MB单位显示
free -m
在命令的输出信息中,各字段所代表的含义如下:
标识 | 含义 |
---|---|
total | 总内存数。 |
used | 已经使用的内存数。 |
free | 空闲的内存数。 |
shared | 多个进程共享的内存总数。 |
buff/cache | 缓冲和缓存内存总数。 |
available | 估计有多少内存可用于启动新应用程序,而不交换。 |
- vmstat:可以动态地监控系统内存,查看系统内存的使用情况。
例如:
# 监测系统内存,显示活跃和非活跃内存
vmstat -a
在命令的输出信息中,与内存相关的memory字段所代表的含义如下:
字段 | 含义 |
---|---|
memory | 内存信息字段。-swpd:虚拟内存的使用情况,单位为 KB。-free:空闲的内存容量,单位为 KB。-inact:非活跃的内存容量,单位为 KB。-active:活跃的内存容量,单位为 KB。 |
- sar:可用于监控系统的内存使用情况。
例如:
# 系统内存在采样时间内的使用情况,每2秒统计一次,统计 3 次
sar -r 2 3
在命令的输出信息中,各字段所代表的含义如下:
字段 | 含义 |
---|---|
kbmemfree | 内存的未使用空间。 |
kbmemused | 内存的已使用空间。 |
%memused | 已使用空间的百分比。 |
kbbuffers | 缓冲区的数据存取量。 |
kbcached | 系统全域的数据存取量。 |
- numactl:可用于查看NUMA节点配置和状态。
例如:
# 安装numactl
yum install -y numactl
# 查看当前的NUMA配置
numactl -H
服务器共划分为1个NUMA节点。每个节点包含4个CPU core,每个节点的内存大小约为6GB。 同时,该命令还给出了不同节点间的距离,距离越远,跨NUMA内存访问的延时越大。应用程序运行时应减少跨NUMA访问内存。
numastat:可用于观察各个NUMA节点的状态
# 观察NUMA节点的状态
numastat
numastat命令输出字段及其含义如下:
标识 | 含义 |
---|---|
numa_hit | 节点内CPU核访问本地内存的次数。 |
numa_miss | 节点内核访问其他节点内存的次数。 |
numa_foreign | 初始分配在本地,最后分配在其他节点的叶数量。每个numa_foreign事件在另一节点上都有对应的numa_miss事件。 |
interleave_hit | interleave策略页成功分配到这个节点。 |
local_node | 该节点的进程成功在这个节点上分配内存访问的大小。 |
other_node | 该节点的进程在其他节点上分配的内存访问大小。 |
I/O
基本概念
I/O表示输入(Input)/输出(Output),输入指系统接收信号或数据的操作,输出指从系统发出信号或数据的操作。对于CPU 和主存储器的组合,任何信息传入或传出 CPU/内存组合,就会被认为是 I/O。
定位定界思路
常用I/O性能分析工具
- iostat:可以汇报所有在线磁盘的统计信息。
例如:
# 详细显示磁盘信息,以KB为单位显示,以100秒为周期统计(命令本身不会主动停止,需要执行Ctrl+C手动停止)
iostat -d -k -x 100
# 详细显示磁盘信息,以KB为单位显示,以1秒为周期统计,总共统计100s
iostat -d -k -x 1 100
在命令的输出信息中,各字段所代表的含义如下:
字段 | 含义 |
---|---|
Device | 监测设备名称。 |
r/s | 设备每秒完成的读取请求数(合并后)。 |
rKB/s | 每秒从磁盘读取KB数。 |
rrqm/s | 每秒合并放入请求队列的读操作数。 |
%rrqm | 读取请求在发送到设备之前合并在一起的百分比。 |
r_await | 每个读请求耗费的平均时间。 |
rareq-sz | 向设备发出的读取请求的平均大小(以KB为单位)。 |
w/s | 设备每秒完成的写入请求数(合并后)。 |
wKB/s | 每秒写入磁盘KB数。 |
wrqm/s | 每秒合并放入请求队列的写操作数。 |
%wrqm | 写入请求在发送到设备之前合并在一起的百分比。 |
w_await | 每个写请求耗费的平均时间。 |
wareq-sz | 向设备发出的写入请求的平均大小(以KB为单位)。 |
d/s | 设备每秒完成的丢弃请求数。 |
dKB/s | 每秒为设备丢弃的扇区(KB)数。 |
drqm/s | 每秒合并到设备排队的丢弃请求数。 |
%drqm | 丢弃请求在发送到设备之前合并在一起的百分比。 |
d_await | 向要服务的设备发出丢弃请求的平均时间。 |
dareq-sz | 向设备发出的丢弃请求的平均大小(以KB为单位)。 |
f/s | 设备每秒完成的刷新请求数(合并后)。 |
f_await | 向要服务的设备发出的刷新请求的平均时间。 |
aqu-sz | 向设备发出的请求的平均队列长度。 |
%util | 用于I/O操作时间的百分比,即使用率。 |
- sar:可用于查看系统磁盘的读写性能。
例如:
# 显示系统所有硬盘设备在采样时间内的使用状态,每3秒统计一次,统计5次
sar -d 3 5
在命令的输出信息中,各字段所代表的含义如下:
标识 | 含义 |
---|---|
tps | 每秒向物理设备发出的传输总数。 |
rKB/s | 每秒从设备读取的KB数。 |
wKB/s | 每秒写入设备的KB数。 |
dKB/s | 设备每秒丢弃的KB数。 |
areq-sz | 向设备发出的I/O请求的平均大小(KB)。 |
aqu-sz | 向设备发出的请求的平均队列长度。 |
await | 向要服务的设备发出的I/O请求的平均时间。 |
%util | 向设备发出I/O请求的已用时间百分比(设备的带宽利用率)。 |
- vmstat
# 使用vmstat进行监测,报告磁盘相关统计信息
vmstat -d
在命令的输出信息中,各字段所代表的含义如下:
字段 | 含义 |
---|---|
reads | -total:已成功完成的读取总数。-merged:分组读取(导致一次I/O)。-sectors:扇区读取成功。-ms:读取花费的毫秒数。 |
writes | -total:已成功完成的写入总数。-merged:分组写入(导致一次I/O)。-sectors:写入成功的扇区。-ms:写入所花费的毫秒数。 |
IO | -cur:正在进行的 I/O 数。-sec:I/O 所花费的秒数。 |