长期支持版本

    系统资源与性能

    CPU

    基本概念

    中央处理器(Central Processing Unit,简称CPU)是计算机的主要设备之一,其功能是解释计算机指令以及处理计算机软件中的数据。

    1. 物理核:可以真实看到的CPU核,有独立的电路元件以及L1、L2缓存,可以独立地执行指令。一个CPU可以有多个物理核。
    2. 逻辑核:在同一个物理核内,逻辑层面上存在的核。一般一个物理核对应一个线程,但是如果开启了超线程,当超线程数量为n时,一个物理核可以分成n个逻辑核。
      可以通过lscpu命令查看服务器中有多少个CPU,每个CPU中有几个物理核,以及每个CPU有几个逻辑核。

    定界定位思路

    常用CPU性能分析工具

    1. uptime:可用于打印系统平均负载,通过查看最后三个数字,可以判断平均负载的变化趋势。
      平均负载大于CPU数量时表示CPU不足以服务线程,部分线程在等待;平均负载小于CPU数量,代表当前还有余量。

    zh-cn_image_0000001384808269

    1. vmstat:可以动态地了解系统资源的使用情况,以及查看系统中是哪一个环节最占用系统资源。
      通过vmstat -h命令可以查看命令详解参数。
      例如:
    #使用vmstat进行监测,每隔1秒刷新一次
    vmstat 1
    

    在命令的输出信息中,各字段所代表的含义如下:

    字段含义
    procs进程信息字段。
    memory内存信息字段。
    swap交换分区信息字段。
    io磁盘读/写信息字段。
    system系统信息字段。
    cpuCPU信息字段-us:非内核进程消耗 CPU 运算时间的百分比。-sy:内核进程消耗 CPU 运算时间的百分比。-id:空闲。-wa:等待 I/O 所消耗的 CPU 百分比。-st:被虚拟机所盗用的 CPU 百分比。
    1. sar:可用于分析系统性能,可以用来观察当前的活动以及配置,用以归档和报告历史统计信息。
      例如:
    # 安装sysstat
    yum install -y sysstat
    
    # 查看系统CPU的整体负载情况,每3秒统计一次,共统计5次
    sar -u 3 5
    

    zh-cn_image_0000001336448570

    在命令的输出信息中,各字段所代表的含义如下:

    字段含义
    %user用户模式下消耗的 CPU 时间的比例。
    %nice通过 nice 改变了进程调度优先级的进程,在用户模式下消耗的 CPU 时间的比例。
    %system系统模式下消耗的 CPU 时间的比例。
    %iowaitCPU 等待磁盘 I/O 导致空闲状态消耗的时间比例。
    %steal利用操作系统等虚拟化技术,等待其他虚拟CPU计算占用的时间比例。
    %idleCPU空闲时间比例。
    1. ps:可用于查看正在运行的进程
    # 查看系统中所有的进程,以及查看进程的父进程的 PID 和进程优先级
    ps -le
    

    zh-cn_image_0000001337039920

    # 查看当前shell产生的进程
    ps -l
    

    zh-cn_image_0000001385611905

    1. top:可以动态地持续监听进程的运行状态,显示最消耗CPU的进程
    top
    

    zh-cn_image_0000001335457246

    内存

    基本概念

    内存是计算机的重要组成部件,用于暂时存放CPU中的运算数据,以及与硬件等外部存储器交换的数据。特别地,非统一内存访问架构(non-uniform memory access,简称NUMA)是一种为多处理器的电脑设计的内存架构,内存访问时间取决于内存相对于处理器的位置。在NUMA下,处理器访问本地内存的速度比非本地内存速度(内存位于另一个处理器,或者是处理器之间共享的内存)快。

    定位定界思路

    常用内存分析工具/方式

    1. free:可用于显示系统内存状态
      例如:
    # 显示系统内存状态,以MB单位显示
    free -m
    

    zh-cn_image_0000001386699925

    在命令的输出信息中,各字段所代表的含义如下:

    标识含义
    total总内存数。
    used已经使用的内存数。
    free空闲的内存数。
    shared多个进程共享的内存总数。
    buff/cache缓冲和缓存内存总数。
    available估计有多少内存可用于启动新应用程序,而不交换。
    1. vmstat:可以动态地监控系统内存,查看系统内存的使用情况。

    例如:

    # 监测系统内存,显示活跃和非活跃内存
    vmstat -a
    

    zh-cn_image_0000001388972645

    在命令的输出信息中,与内存相关的memory字段所代表的含义如下:

    字段含义
    memory内存信息字段。-swpd:虚拟内存的使用情况,单位为 KB。-free:空闲的内存容量,单位为 KB。-inact:非活跃的内存容量,单位为 KB。-active:活跃的内存容量,单位为 KB。
    1. sar:可用于监控系统的内存使用情况

    例如:

    # 系统内存在采样时间内的使用情况,每2秒统计一次,统计 3 次
    sar -r 2 3
    

    zh-cn_image_0000001335816300

    在命令的输出信息中,各字段所代表的含义如下:

    字段含义
    kbmemfree内存的未使用空间。
    kbmemused内存的已使用空间。
    %memused已使用空间的百分比。
    kbbuffers缓冲区的数据存取量。
    kbcached系统全域的数据存取量。
    1. numactl:可用于查看NUMA节点配置和状态

    例如:

    # 查看当前的NUMA配置
    numactl -H
    

    zh-cn_image_0000001337000118

    服务器共划分为1个NUMA节点。每个节点包含4个CPU core,每个节点的内存大小约为6GB。
    同时,该命令还给出了不同节点间的距离,距离越远,跨NUMA内存访问的延时越大。应用程序运行时应减少跨NUMA访问内存。

    numastat:可用于观察各个NUMA节点的状态

    # 观察NUMA节点的状态
    numastat
    

    zh-cn_image_0000001337172594

    numastat命令输出字段及其含义如下:

    标识含义
    numa_hit节点内CPU核访问本地内存的次数。
    numa_miss节点内核访问其他节点内存的次数。
    numa_foreign初始分配在本地,最后分配在其他节点的页数量。每个numa_foreign对应numa_miss事件。
    interleave_hitinterleave策略页成功分配到这个节点。
    local_node该节点的进程成功在这个节点上分配内存访问的大小。
    other_node该节点的进程在其他节点上分配的内存访问大小。

    I/O

    基本概念

    I/O表示输入(Input)/输出(Output),输入指系统接收信号或数据的操作,输出指从系统发出信号或数据的操作。对于CPU 和主存储器的组合,任何信息传入或传出 CPU/内存组合,就会被认为是 I/O

    定位定界思路

    常用I/O性能分析工具

    1. iostat:可以汇报所有在线磁盘的统计信息

    例如:

    # 详细显示磁盘信息,以KB为单位显示,以100秒为周期统计(命令本身不会主动停止,需要执行Ctrl+C手动停止)
    iostat -d -k -x 100
    
    # 详细显示磁盘信息,以KB为单位显示,以1秒为周期统计,总共统计100s
    iostat -d -k -x 1 100
    

    zh-cn_image_0000001385905845

    在命令的输出信息中,各字段所代表的含义如下:

    字段含义
    Device监测设备名称。
    r/s设备每秒完成的读取请求数(合并后)。
    rKB/s每秒从磁盘读取KB数。
    rrqm/s每秒合并放入请求队列的读操作数。
    %rrqm读取请求在发送到设备之前合并在一起的百分比。
    r_await每个读请求耗费的平均时间。
    rareq-sz向设备发出的读取请求的平均大小(以KB为单位)。
    w/s设备每秒完成的写入请求数(合并后)。
    wKB/s每秒写入磁盘KB数。
    wrqm/s每秒合并放入请求队列的写操作数。
    %wrqm写入请求在发送到设备之前合并在一起的百分比。
    w_await每个写请求耗费的平均时间。
    wareq-sz向设备发出的写入请求的平均大小(以KB为单位)。
    d/s设备每秒完成的丢弃请求数。
    dKB/s每秒为设备丢弃的扇区(KB)数。
    drqm/s每秒合并到设备排队的丢弃请求数。
    %drqm丢弃请求在发送到设备之前合并在一起的百分比。
    d_await向要服务的设备发出丢弃请求的平均时间。
    dareq-sz向设备发出的丢弃请求的平均大小(以KB为单位)。
    f/s设备每秒完成的刷新请求数(合并后)。
    f_await向要服务的设备发出的刷新请求的平均时间。
    aqu-sz向设备发出的请求的平均队列长度。
    %util用于I/O操作时间的百分比,即使用率。
    1. sar:可用于查看系统磁盘的读写性能

    例如:

    # 显示系统所有硬盘设备在采样时间内的使用状态,每3秒统计一次,统计5次
    sar -d 3 5
    

    zh-cn_image_0000001386149037

    在命令的输出信息中,各字段所代表的含义如下:

    标识含义
    tps每秒向物理设备发出的传输总数。
    rKB/s每秒从设备读取的KB数。
    wKB/s每秒写入设备的KB数。
    dKB/s设备每秒丢弃的KB数。
    areq-sz向设备发出的I/O请求的平均大小(KB)。
    aqu-sz向设备发出的请求的平均队列长度。
    await向要服务的设备发出的I/O请求的平均时间。
    %util向设备发出I/O请求的已用时间百分比(设备的带宽利用率)。
    1. vmstat
    # 使用vmstat进行监测,报告磁盘相关统计信息
    vmstat -d
    

    zh-cn_image_0000001389098425

    在命令的输出信息中,各字段所代表的含义如下:

    字段含义
    reads-total:已成功完成的读取总数。-merged:分组读取(导致一次I/O)。-sectors:扇区读取成功。-ms:读取花费的毫秒数。
    writes-total:已成功完成的写入总数。-merged:分组写入(导致一次I/O)。-sectors:写入成功的扇区。-ms:写入所花费的毫秒数。
    IO磁盘读/写信息字段。-cur 正在进行的 I/O 数。-sec I/O 所花费的秒数。

    文档捉虫

    “有虫”文档片段

    问题描述

    提交类型 issue

    有点复杂...

    找人问问吧。

    PR

    小问题,全程线上修改...

    一键搞定!

    问题类型
    规范和低错类

    ● 错别字或拼写错误;标点符号使用错误;

    ● 链接错误、空单元格、格式错误;

    ● 英文中包含中文字符;

    ● 界面和描述不一致,但不影响操作;

    ● 表述不通顺,但不影响理解;

    ● 版本号不匹配:如软件包名称、界面版本号;

    易用性

    ● 关键步骤错误或缺失,无法指导用户完成任务;

    ● 缺少必要的前提条件、注意事项等;

    ● 图形、表格、文字等晦涩难懂;

    ● 逻辑不清晰,该分类、分项、分步骤的没有给出;

    正确性

    ● 技术原理、功能、规格等描述和软件不一致,存在错误;

    ● 原理图、架构图等存在错误;

    ● 命令、命令参数等错误;

    ● 代码片段错误;

    ● 命令无法完成对应功能;

    ● 界面错误,无法指导操作;

    风险提示

    ● 对重要数据或系统存在风险的操作,缺少安全提示;

    内容合规

    ● 违反法律法规,涉及政治、领土主权等敏感词;

    ● 内容侵权;

    您对文档的总体满意度

    非常不满意
    非常满意
    提交
    根据您的反馈,会自动生成issue模板。您只需点击按钮,创建issue即可。
    文档捉虫
    编组 3备份