长期支持版本

    社区创新版本

      系统资源与性能

      CPU

      基本概念

      中央处理器(Central Processing Unit,简称CPU)是计算机的主要设备之一,其功能是解释计算机指令以及处理计算机软件中的数据。

      1. 物理核:可以真实看到的CPU核,有独立的电路元件以及L1、L2缓存,可以独立地执行指令。一个CPU可以有多个物理核。
      2. 逻辑核:在同一个物理核内,逻辑层面上存在的核。一般一个物理核对应一个线程,但是如果开启了超线程,当超线程数量为n时,一个物理核可以分成n个逻辑核。
        可以通过lscpu命令查看服务器中有多少个CPU,每个CPU中有几个物理核,以及每个CPU有几个逻辑核。

      定界定位思路

      常用CPU性能分析工具

      1. uptime:可用于打印系统平均负载,通过查看最后三个数字,可以判断平均负载的变化趋势。
        平均负载大于CPU数量时表示CPU不足以服务线程,部分线程在等待;平均负载小于CPU数量,代表当前还有余量。

      zh-cn_image_0000001384808269

      1. vmstat:可以动态地了解系统资源的使用情况,以及查看系统中是哪一个环节最占用系统资源。
        通过vmstat -h命令可以查看命令详解参数。
        例如:
      #使用vmstat进行监测,每隔1秒刷新一次
      vmstat 1
      

      在命令的输出信息中,各字段所代表的含义如下:

      字段含义
      procs进程信息字段。
      memory内存信息字段。
      swap交换分区信息字段。
      io磁盘读/写信息字段。
      system系统信息字段。
      cpuCPU信息字段-us:非内核进程消耗 CPU 运算时间的百分比。-sy:内核进程消耗 CPU 运算时间的百分比。-id:空闲。-wa:等待 I/O 所消耗的 CPU 百分比。-st:被虚拟机所盗用的 CPU 百分比。
      1. sar:可用于分析系统性能,可以用来观察当前的活动以及配置,用以归档和报告历史统计信息。
        例如:
      # 安装sysstat
      yum install -y sysstat
      
      # 查看系统CPU的整体负载情况,每3秒统计一次,共统计5次
      sar -u 3 5
      

      zh-cn_image_0000001336448570

      在命令的输出信息中,各字段所代表的含义如下:

      字段含义
      %user用户模式下消耗的 CPU 时间的比例。
      %nice通过 nice 改变了进程调度优先级的进程,在用户模式下消耗的 CPU 时间的比例。
      %system系统模式下消耗的 CPU 时间的比例。
      %iowaitCPU 等待磁盘 I/O 导致空闲状态消耗的时间比例。
      %steal利用操作系统等虚拟化技术,等待其他虚拟CPU计算占用的时间比例。
      %idleCPU空闲时间比例。
      1. ps:可用于查看正在运行的进程
      # 查看系统中所有的进程,以及查看进程的父进程的 PID 和进程优先级
      ps -le
      

      zh-cn_image_0000001337039920

      # 查看当前shell产生的进程
      ps -l
      

      zh-cn_image_0000001385611905

      1. top:可以动态地持续监听进程的运行状态,显示最消耗CPU的进程
      top
      

      zh-cn_image_0000001335457246

      内存

      基本概念

      内存是计算机的重要组成部件,用于暂时存放CPU中的运算数据,以及与硬件等外部存储器交换的数据。特别地,非统一内存访问架构(non-uniform memory access,简称NUMA)是一种为多处理器的电脑设计的内存架构,内存访问时间取决于内存相对于处理器的位置。在NUMA下,处理器访问本地内存的速度比非本地内存速度(内存位于另一个处理器,或者是处理器之间共享的内存)快。

      定位定界思路

      常用内存分析工具/方式

      1. free:可用于显示系统内存状态
        例如:
      # 显示系统内存状态,以MB单位显示
      free -m
      

      zh-cn_image_0000001386699925

      在命令的输出信息中,各字段所代表的含义如下:

      标识含义
      total总内存数。
      used已经使用的内存数。
      free空闲的内存数。
      shared多个进程共享的内存总数。
      buff/cache缓冲和缓存内存总数。
      available估计有多少内存可用于启动新应用程序,而不交换。
      1. vmstat:可以动态地监控系统内存,查看系统内存的使用情况。

      例如:

      # 监测系统内存,显示活跃和非活跃内存
      vmstat -a
      

      zh-cn_image_0000001388972645

      在命令的输出信息中,与内存相关的memory字段所代表的含义如下:

      字段含义
      memory内存信息字段。-swpd:虚拟内存的使用情况,单位为 KB。-free:空闲的内存容量,单位为 KB。-inact:非活跃的内存容量,单位为 KB。-active:活跃的内存容量,单位为 KB。
      1. sar:可用于监控系统的内存使用情况

      例如:

      # 系统内存在采样时间内的使用情况,每2秒统计一次,统计 3 次
      sar -r 2 3
      

      zh-cn_image_0000001335816300

      在命令的输出信息中,各字段所代表的含义如下:

      字段含义
      kbmemfree内存的未使用空间。
      kbmemused内存的已使用空间。
      %memused已使用空间的百分比。
      kbbuffers缓冲区的数据存取量。
      kbcached系统全域的数据存取量。
      1. numactl:可用于查看NUMA节点配置和状态

      例如:

      # 查看当前的NUMA配置
      numactl -H
      

      zh-cn_image_0000001337000118

      服务器共划分为1个NUMA节点。每个节点包含4个CPU core,每个节点的内存大小约为6GB。
      同时,该命令还给出了不同节点间的距离,距离越远,跨NUMA内存访问的延时越大。应用程序运行时应减少跨NUMA访问内存。

      numastat:可用于观察各个NUMA节点的状态

      # 观察NUMA节点的状态
      numastat
      

      zh-cn_image_0000001337172594

      numastat命令输出字段及其含义如下:

      标识含义
      numa_hit节点内CPU核访问本地内存的次数。
      numa_miss节点内核访问其他节点内存的次数。
      numa_foreign初始分配在本地,最后分配在其他节点的页数量。每个numa_foreign对应numa_miss事件。
      interleave_hitinterleave策略页成功分配到这个节点。
      local_node该节点的进程成功在这个节点上分配内存访问的大小。
      other_node该节点的进程在其他节点上分配的内存访问大小。

      I/O

      基本概念

      I/O表示输入(Input)/输出(Output),输入指系统接收信号或数据的操作,输出指从系统发出信号或数据的操作。对于CPU 和主存储器的组合,任何信息传入或传出 CPU/内存组合,就会被认为是 I/O

      定位定界思路

      常用I/O性能分析工具

      1. iostat:可以汇报所有在线磁盘的统计信息

      例如:

      # 详细显示磁盘信息,以KB为单位显示,以100秒为周期统计(命令本身不会主动停止,需要执行Ctrl+C手动停止)
      iostat -d -k -x 100
      
      # 详细显示磁盘信息,以KB为单位显示,以1秒为周期统计,总共统计100s
      iostat -d -k -x 1 100
      

      zh-cn_image_0000001385905845

      在命令的输出信息中,各字段所代表的含义如下:

      字段含义
      Device监测设备名称。
      r/s设备每秒完成的读取请求数(合并后)。
      rKB/s每秒从磁盘读取KB数。
      rrqm/s每秒合并放入请求队列的读操作数。
      %rrqm读取请求在发送到设备之前合并在一起的百分比。
      r_await每个读请求耗费的平均时间。
      rareq-sz向设备发出的读取请求的平均大小(以KB为单位)。
      w/s设备每秒完成的写入请求数(合并后)。
      wKB/s每秒写入磁盘KB数。
      wrqm/s每秒合并放入请求队列的写操作数。
      %wrqm写入请求在发送到设备之前合并在一起的百分比。
      w_await每个写请求耗费的平均时间。
      wareq-sz向设备发出的写入请求的平均大小(以KB为单位)。
      d/s设备每秒完成的丢弃请求数。
      dKB/s每秒为设备丢弃的扇区(KB)数。
      drqm/s每秒合并到设备排队的丢弃请求数。
      %drqm丢弃请求在发送到设备之前合并在一起的百分比。
      d_await向要服务的设备发出丢弃请求的平均时间。
      dareq-sz向设备发出的丢弃请求的平均大小(以KB为单位)。
      f/s设备每秒完成的刷新请求数(合并后)。
      f_await向要服务的设备发出的刷新请求的平均时间。
      aqu-sz向设备发出的请求的平均队列长度。
      %util用于I/O操作时间的百分比,即使用率。
      1. sar:可用于查看系统磁盘的读写性能

      例如:

      # 显示系统所有硬盘设备在采样时间内的使用状态,每3秒统计一次,统计5次
      sar -d 3 5
      

      zh-cn_image_0000001386149037

      在命令的输出信息中,各字段所代表的含义如下:

      标识含义
      tps每秒向物理设备发出的传输总数。
      rKB/s每秒从设备读取的KB数。
      wKB/s每秒写入设备的KB数。
      dKB/s设备每秒丢弃的KB数。
      areq-sz向设备发出的I/O请求的平均大小(KB)。
      aqu-sz向设备发出的请求的平均队列长度。
      await向要服务的设备发出的I/O请求的平均时间。
      %util向设备发出I/O请求的已用时间百分比(设备的带宽利用率)。
      1. vmstat
      # 使用vmstat进行监测,报告磁盘相关统计信息
      vmstat -d
      

      zh-cn_image_0000001389098425

      在命令的输出信息中,各字段所代表的含义如下:

      字段含义
      reads-total:已成功完成的读取总数。-merged:分组读取(导致一次I/O)。-sectors:扇区读取成功。-ms:读取花费的毫秒数。
      writes-total:已成功完成的写入总数。-merged:分组写入(导致一次I/O)。-sectors:写入成功的扇区。-ms:写入所花费的毫秒数。
      IO磁盘读/写信息字段。-cur 正在进行的 I/O 数。-sec I/O 所花费的秒数。

      文档捉虫

      “有虫”文档片段

      问题描述

      提交类型 issue

      有点复杂...

      找人问问吧。

      PR

      小问题,全程线上修改...

      一键搞定!

      问题类型
      规范和低错类

      ● 错别字或拼写错误;标点符号使用错误;

      ● 链接错误、空单元格、格式错误;

      ● 英文中包含中文字符;

      ● 界面和描述不一致,但不影响操作;

      ● 表述不通顺,但不影响理解;

      ● 版本号不匹配:如软件包名称、界面版本号;

      易用性

      ● 关键步骤错误或缺失,无法指导用户完成任务;

      ● 缺少必要的前提条件、注意事项等;

      ● 图形、表格、文字等晦涩难懂;

      ● 逻辑不清晰,该分类、分项、分步骤的没有给出;

      正确性

      ● 技术原理、功能、规格等描述和软件不一致,存在错误;

      ● 原理图、架构图等存在错误;

      ● 命令、命令参数等错误;

      ● 代码片段错误;

      ● 命令无法完成对应功能;

      ● 界面错误,无法指导操作;

      风险提示

      ● 对重要数据或系统存在风险的操作,缺少安全提示;

      内容合规

      ● 违反法律法规,涉及政治、领土主权等敏感词;

      ● 内容侵权;

      您对文档的总体满意度

      非常不满意
      非常满意
      提交
      根据您的反馈,会自动生成issue模板。您只需点击按钮,创建issue即可。
      文档捉虫
      编组 3备份