长期支持版本

    社区创新版本

      CPDS介绍

      概述

      CPDS (Container Problem Detect System) 容器故障检测系统,是由北京凝思软件股份有限公司设计并开发的容器集群故障检测系统,该软件系统实现了对容器TOP故障、亚健康检测的监测与识别。

      软件功能

      1. 采集集群信息

      在宿主机上实现节点代理,采用systemd、initv、ebpf等技术,对容器关键服务进行监控;对节点网络、内核、磁盘LVM等相关信息进行采集;对容器内的应用状态、资源消耗情况、关键系统函数执行情况、io执行状态等执行异常进行监控。

      2. 集群异常检测

      采集各节点原始数据,基于异常规则对采集的原始数据进行异常检测,提取关键信息。同时基于异常规则对采集数据进行异常检测,后将检测结果数据和原始数据进行在线上传,并同步进行持久化操作。

      3. 节点、业务容器故障/亚健康诊断

      基于异常检测数据,对节点、业务容器进行故障/亚健康诊断,将分析检测结果进行持久化存储,并提供UI层进行实时、历史的诊断数据查看。

      软件架构

      CPDS (Container Problem Detect System) 容器故障检测系统由4个组件组成,如下图所示,整体采用微服务架构,组件之间通过API进行通信。

      Architecture

      • cpds-agent:信息采集组件,负责采集集群各节点的容器和系统原始数据。

      • cpds-detector:异常检测组件,根据配置的异常规则对各节点原始数据进行分析,检测节点是否存在异常。

      • cpds-analyzer:故障/亚健康诊断组件,根据配置的诊断规则,对异常节点进行健康分析,计算出节点当前健康状态。

      • cpds-dashboard:用户交互组件,提供web页面,对集群内节点健康情况进行展示,支持诊断规则配置下发。

      特性

      CPDS支持对以下故障项进行检测。

      序号故障检测项
      1容器服务是否正常
      2容器节点代理是否正常
      3容器组是否正常
      4节点健康检测是否正常
      5日志采集是否正常
      6磁盘用量占容量85%
      7网络故障
      8内核Crash故障
      9残留LVM盘故障
      10CPU使用率超过85%
      11节点监控是否正常
      12容器内存申请失败
      13容器内存申请超时
      14容器网络响应超时
      15容器磁盘读写缓慢
      16容器应用僵尸子进程监测
      17容器应用占用子进程、线程创建失败监测

      文档捉虫

      “有虫”文档片段

      问题描述

      提交类型 issue

      有点复杂...

      找人问问吧。

      PR

      小问题,全程线上修改...

      一键搞定!

      问题类型
      规范和低错类

      ● 错别字或拼写错误;标点符号使用错误;

      ● 链接错误、空单元格、格式错误;

      ● 英文中包含中文字符;

      ● 界面和描述不一致,但不影响操作;

      ● 表述不通顺,但不影响理解;

      ● 版本号不匹配:如软件包名称、界面版本号;

      易用性

      ● 关键步骤错误或缺失,无法指导用户完成任务;

      ● 缺少必要的前提条件、注意事项等;

      ● 图形、表格、文字等晦涩难懂;

      ● 逻辑不清晰,该分类、分项、分步骤的没有给出;

      正确性

      ● 技术原理、功能、规格等描述和软件不一致,存在错误;

      ● 原理图、架构图等存在错误;

      ● 命令、命令参数等错误;

      ● 代码片段错误;

      ● 命令无法完成对应功能;

      ● 界面错误,无法指导操作;

      风险提示

      ● 对重要数据或系统存在风险的操作,缺少安全提示;

      内容合规

      ● 违反法律法规,涉及政治、领土主权等敏感词;

      ● 内容侵权;

      您对文档的总体满意度

      非常不满意
      非常满意
      提交
      根据您的反馈,会自动生成issue模板。您只需点击按钮,创建issue即可。
      文档捉虫
      编组 3备份