长期支持版本

    AOps 智能定位框架使用手册

    参照AOps部署指南部署AOps前后端服务后,即可使用AOps智能定位框架。

    下文会从页面的维度进行AOps智能定位框架功能的介绍。

    1. 工作台

    该页面为数据看板页面,用户登录后,仍在该页面。

    4911661916984_.pic

    支持操作:

    • 当前纳管的主机数量

    • 当前所有未确认的告警数量

    • 每个主机组告警情况的统计

    • 用户账户操作

      • 修改密码
      • 退出登录
    • 业务域和CVE信息暂不支持

    2. 资产管理

    资产管理分为对主机组进行管理以及对主机进行管理。每个主机在agent侧注册时需指定一个已存在的主机组进行注册,注册完毕后会在前端进行显示。

    (1)主机组页面:

    4761661915951_.pic

    支持如下操作:

    • 主机组添加
    • 主机组删除
    • 查看当前所有主机组
    • 查看每个主机组下的主机信息

    添加主机组时,需指定主机组的名称和描述。注意:请勿添加重复的主机组名称。

    添加主机组

    (2)主机管理页面:

    主机管理

    支持如下操作:

    • 查看主机列表(可根据主机组、管理节点进行筛选,可根据主机名称进行排序)
    • 删除主机
    • 点击主机可跳转到主机详情界面

    (3)主机详细信息界面:

    主机详情

    详情页的上半部分展示了该主机的操作系统及CPU等的基础信息。

    插件管理

    详情页的下半部分,用户可以看到该主机当前运行的采集插件信息(目前agent只支持gala-gopher插件)。

    支持如下操作:

    • 查看主机基础信息及插件信息
    • 插件的管理(gala-gopher)
      • 插件资源查看
      • 插件的开启和管理
      • gala-gopher的采集探针的开启和关闭
    • 主机场景的识别

    点击场景识别后,系统会生成该主机的场景,并推荐检测该场景所需开启的插件以及采集项,用户可以推荐结果进行插件/探针的调整。

    注意:修改插件信息如关闭插件或开关探针后,需要点击保存才能生效。

    修改插件

    3. 智能定位

    AOps项目的智能定位策略采用内置网络诊断应用作为模板,生成个性化工作流的策略进行检测和诊断。

    “应用”作为工作流的模板,描述了检测中各步骤的串联情况,内置各步骤中使用的检测模型的推荐逻辑。用户在生成工作流时,可根据各主机的采集项、场景等信息,定制出工作流的详细信息。

    (1)工作流列表页面:

    工作流

    支持操作:

    • 查看当前工作流列表,支持按照主机组、应用和状态进行筛选,并支持分页操作
    • 查看当前应用列表

    (2)工作流详情页面:

    工作流详情

    支持操作:

    • 查看工作流所属主机组、主机数量、状态等基础信息
    • 查看单指标检测、多指标检测、集群故障诊断各步骤的详细算法模型信息
    • 修改检测各步骤应用的模型
    • 执行、暂停和删除工作流

    修改某检测步骤的模型时,用户可根据模型名或标签搜索系统内置的模型库,选中模型后点击右下角“应用”按钮进行更改。

    修改模型

    (3)应用详情页面

    app详情

    支持操作:

    • 查看应用的整体流程
    • 基于应用创建工作流

    创建工作流时,点击右上角的“创建工作流”按钮,并在右侧弹出的窗口中输入工作流的名称和描述,选择要检测的主机组。选中主机组后,下方会列出该主机组的所有主机,用户可选中部分主机后移到右侧的列表,最后点击创建,即可在工作流列表中看到新创建的工作流。

    app详情

    创建工作流

    (4)告警

    启动工作流后,会根据工作流的执行周期定时触发诊断,每次诊断结果若为异常,则会作为一条告警存入数据库,同时也会反映在前端告警页面中。

    告警

    支持操作:

    • 查看当前告警总数
    • 查看各主机组的告警数量
    • 查看告警列表
    • 告警确认
    • 查看告警详情
    • 下载诊断报告

    点击操作列“确认”可进行告警确认,告警确认后,将不在列表中显示。

    告警确认

    点击操作列“异常详情”后,可以根据主机维度查看告警详情,包括异常数据项的展示以及根因节点、根因异常的判断等。

    告警详情

    4. 配置溯源

    AOps项目的配置溯源用于对目标主机配置文件内容的变动进行检测记录,对于定位文件配置错误类引发的故障起到很好的支撑作用。

    创建业务域

    添加业务域纳管node

    添加业务域配置

    查询预期配置

    删除配置

    查询实际配置

    配置校验

    配置同步

    暂未提供

    文档捉虫

    “有虫”文档片段

    问题描述

    提交类型 issue

    有点复杂...

    找人问问吧。

    PR

    小问题,全程线上修改...

    一键搞定!

    问题类型
    规范和低错类

    ● 错别字或拼写错误;标点符号使用错误;

    ● 链接错误、空单元格、格式错误;

    ● 英文中包含中文字符;

    ● 界面和描述不一致,但不影响操作;

    ● 表述不通顺,但不影响理解;

    ● 版本号不匹配:如软件包名称、界面版本号;

    易用性

    ● 关键步骤错误或缺失,无法指导用户完成任务;

    ● 缺少必要的前提条件、注意事项等;

    ● 图形、表格、文字等晦涩难懂;

    ● 逻辑不清晰,该分类、分项、分步骤的没有给出;

    正确性

    ● 技术原理、功能、规格等描述和软件不一致,存在错误;

    ● 原理图、架构图等存在错误;

    ● 命令、命令参数等错误;

    ● 代码片段错误;

    ● 命令无法完成对应功能;

    ● 界面错误,无法指导操作;

    风险提示

    ● 对重要数据或系统存在风险的操作,缺少安全提示;

    内容合规

    ● 违反法律法规,涉及政治、领土主权等敏感词;

    ● 内容侵权;

    您对文档的总体满意度

    非常不满意
    非常满意
    提交
    根据您的反馈,会自动生成issue模板。您只需点击按钮,创建issue即可。
    文档捉虫
    编组 3备份