系统资源与性能

CPU

基本概念

中央处理器(Central Processing Unit,简称CPU)是计算机的主要设备之一,其功能是解释计算机指令以及处理计算机软件中的数据。

  1. 物理核:可以真实看到的CPU核,有独立的电路元件以及L1、L2缓存,可以独立地执行指令。一个CPU可以有多个物理核。
  2. 逻辑核:在同一个物理核内,逻辑层面上存在的核。一般一个物理核对应一个线程,但是如果开启了超线程,当超线程数量为n时,一个物理核可以分成n个逻辑核。 可以通过lscpu命令查看服务器中有多少个CPU,每个CPU中有几个物理核,以及每个CPU有几个逻辑核。

定界定位思路

常用CPU性能分析工具

  1. uptime:可用于打印系统平均负载,通过查看最后三个数字,可以判断平均负载的变化趋势。 平均负载大于CPU数量时表示CPU不足以服务线程,部分线程在等待;平均负载小于CPU数量,代表当前还有余量。

zh-cn_image_0000001384808269

  1. vmstat:可以动态地了解系统资源的使用情况,以及查看系统中是哪一个环节最占用系统资源。 通过vmstat -h命令可以查看命令详解参数。 例如:
#使用vmstat进行监测,每隔1秒刷新一次
vmstat 1

在命令的输出信息中,各字段所代表的含义如下:

字段含义
procs进程信息字段。
memory内存信息字段。
swap交换分区信息字段。
io磁盘读/写信息字段。
system系统信息字段。
cpuCPU信息字段-us:非内核进程消耗 CPU 运算时间的百分比。-sy:内核进程消耗 CPU 运算时间的百分比。-id:空闲。-wa:等待 I/O 所消耗的 CPU 百分比。-st:被虚拟机所盗用的 CPU 百分比。
  1. sar:可用于分析系统性能,可以用来观察当前的活动以及配置,用以归档和报告历史统计信息。 例如:
# 查看系统CPU的整体负载情况,每3秒统计一次,共统计5次
sar -u 3 5

zh-cn_image_0000001336448570

在命令的输出信息中,各字段所代表的含义如下:

字段含义
%user用户模式下消耗的 CPU 时间的比例。
%nice通过 nice 改变了进程调度优先级的进程,在用户模式下消耗的 CPU 时间的比例。
%system系统模式下消耗的 CPU 时间的比例。
%iowaitCPU 等待磁盘 I/O 导致空闲状态消耗的时间比例。
%steal利用操作系统等虚拟化技术,等待其他虚拟CPU计算占用的时间比例。
%idleCPU空闲时间比例。
  1. ps:可用于查看正在运行的进程
# 查看系统中所有的进程,以及查看进程的父进程的 PID 和进程优先级
ps -le

zh-cn_image_0000001337039920

# 查看当前shell产生的进程
ps -l

zh-cn_image_0000001385611905

  1. top:可以动态地持续监听进程的运行状态,显示最消耗CPU的进程
top

zh-cn_image_0000001335457246

内存

基本概念

内存是计算机的重要组成部件,用于暂时存放CPU中的运算数据,以及与硬件等外部存储器交换的数据。特别地,非统一内存访问架构(non-uniform memory access,简称NUMA)是一种为多处理器的电脑设计的内存架构,内存访问时间取决于内存相对于处理器的位置。在NUMA下,处理器访问本地内存的速度比非本地内存速度(内存位于另一个处理器,或者是处理器之间共享的内存)快。

定位定界思路

常用内存分析工具/方式

  1. free:可用于显示系统内存状态。 例如:
# 显示系统内存状态,以MB单位显示
free -m

zh-cn_image_0000001386699925

在命令的输出信息中,各字段所代表的含义如下:

标识含义
total总内存数。
used已经使用的内存数。
free空闲的内存数。
shared多个进程共享的内存总数。
buff/cache缓冲和缓存内存总数。
available估计有多少内存可用于启动新应用程序,而不交换。
  1. vmstat:可以动态地监控系统内存,查看系统内存的使用情况。

例如:

# 监测系统内存,显示活跃和非活跃内存
vmstat -a

zh-cn_image_0000001388972645

在命令的输出信息中,与内存相关的memory字段所代表的含义如下:

字段含义
memory内存信息字段。-swpd:虚拟内存的使用情况,单位为 KB。-free:空闲的内存容量,单位为 KB。-inact:非活跃的内存容量,单位为 KB。-active:活跃的内存容量,单位为 KB。
  1. sar:可用于监控系统的内存使用情况

例如:

# 系统内存在采样时间内的使用情况,每2秒统计一次,统计 3 次
sar -r 2 3

zh-cn_image_0000001335816300

在命令的输出信息中,各字段所代表的含义如下:

字段含义
kbmemfree内存的未使用空间。
kbmemused内存的已使用空间。
%memused已使用空间的百分比。
kbbuffers缓冲区的数据存取量。
kbcached系统全域的数据存取量。
  1. numactl:可用于查看NUMA节点配置和状态

例如:

# 查看当前的NUMA配置
numactl -H

zh-cn_image_0000001337000118

# 观察NUMA节点的状态
numastat

zh-cn_image_0000001337172594

numstat命令输出字段及其含义如下:

标识含义
numa_hit节点内CPU核访问本地内存的次数。
numa_miss节点内核访问其他节点内存的次数。

I/O

基本概念

I/O表示输入(Input)/输出(Output),输入指系统接收信号或数据的操作,输出指从系统发出信号或数据的操作。对于CPU 和主存储器的组合,任何信息传入或传出 CPU/内存组合,就会被认为是 I/O

定位定界思路

常用I/O性能分析工具

  1. iostat:可以汇报所有在线磁盘的统计信息

例如:

# 详细显示磁盘信息,以KB为单位显示,以1秒为周期统计,总共统计100s
iostat -d -k -x 100

zh-cn_image_0000001385905845

在命令的输出信息中,各字段所代表的含义如下:

字段含义
Device监测设备名称。
r/s设备每秒完成的读取请求数(合并后)。
rKB/s每秒从磁盘读取KB数。
rrqm/s每秒合并放入请求队列的读操作数。
%rrqm读取请求在发送到设备之前合并在一起的百分比。
r_await每个读请求耗费的平均时间。
rareq-sz向设备发出的读取请求的平均大小(以KB为单位)。
w/s设备每秒完成的写入请求数(合并后)。
wKB/s每秒写入磁盘KB数。
wrqm/s每秒合并放入请求队列的写操作数。
%wrqm写入请求在发送到设备之前合并在一起的百分比。
w_await每个写请求耗费的平均时间。
wareq-sz向设备发出的写入请求的平均大小(以KB为单位)。
d/s设备每秒完成的丢弃请求数。
dKB/s每秒为设备丢弃的扇区(KB)数。
drqm/s每秒合并到设备排队的丢弃请求数。
%drqm丢弃请求在发送到设备之前合并在一起的百分比。
d_await向要服务的设备发出丢弃请求的平均时间。
dareq-sz向设备发出的丢弃请求的平均大小(以KB为单位)。
f/s设备每秒完成的刷新请求数(合并后)。
f_await向要服务的设备发出的刷新请求的平均时间。
aqu-sz向设备发出的请求的平均队列长度。
%util用于I/O操作时间的百分比,即使用率。
  1. sar:可用于查看系统磁盘的读写性能

例如:

# 显示系统所有硬盘设备在采样时间内的使用状态,每3秒统计一次,统计5次
sar -d 3 5

zh-cn_image_0000001386149037

在命令的输出信息中,各字段所代表的含义如下:

标识含义
tps每秒向物理设备发出的传输总数。
rKB/s每秒从设备读取的KB数。
wKB/s每秒写入设备的KB数。
dKB/s设备每秒丢弃的KB数。
areq-sz向设备发出的I/O请求的平均大小(KB)。
aqu-sz向设备发出的请求的平均队列长度。
await向要服务的设备发出的I/O请求的平均时间。
%util向设备发出I/O请求的已用时间百分比(设备的带宽利用率)。
  1. vmstat
# 使用vmstat进行监测,报告磁盘相关统计信息
vmstat -d

zh-cn_image_0000001389098425

在命令的输出信息中,各字段所代表的含义如下:

字段含义
reads-total:已成功完成的读取总数。-merged:分组读取(导致一次I/O)。-sectors:扇区读取成功。-ms:读取花费的毫秒数。
writes-total:已成功完成的写入总数。-merged:分组写入(导致一次I/O)。-sectors:写入成功的扇区。-ms:写入所花费的毫秒数。
IO磁盘读/写信息字段。-bi:从块设备中读入的数据的总量,单位是块。-bo:写到块设备的数据的总量,单位是块。

文档捉虫

“有虫”文档片段

问题描述

提交类型 issue
有点复杂...
找人问问吧。
PR
小问题,全程线上修改...
一键搞定!
问题类型
规范和低错类

● 错别字或拼写错误;标点符号使用错误;

● 链接错误、空单元格、格式错误;

● 英文中包含中文字符;

● 界面和描述不一致,但不影响操作;

● 表述不通顺,但不影响理解;

● 版本号不匹配:如软件包名称、界面版本号;

易用性

● 关键步骤错误或缺失,无法指导用户完成任务;

● 缺少必要的前提条件、注意事项等;

● 图形、表格、文字等晦涩难懂;

● 逻辑不清晰,该分类、分项、分步骤的没有给出;

正确性

● 技术原理、功能、规格等描述和软件不一致,存在错误;

● 原理图、架构图等存在错误;

● 命令、命令参数等错误;

● 代码片段错误;

● 命令无法完成对应功能;

● 界面错误,无法指导操作;

风险提示

● 对重要数据或系统存在风险的操作,缺少安全提示;

内容合规

● 违反法律法规,涉及政治、领土主权等敏感词;

● 内容侵权;

您对文档的总体满意度

非常不满意
非常满意
提交
根据您的反馈,会自动生成issue模板。您只需点击按钮,创建issue即可。