1. 监控预警
1.1. 功能截图
1.1.1. 预警历史
展示自定义预警和其他系统预警历史,提供时间范围、应用、实例、名称、类型、级别、是否处理、是否发送、排序等多种检索条件
特殊列说明
是否发送:表示该规则是否已经通知出去(短信、邮件等),点击“是否发送”列可以查看具体发送日志
是否处理:用户是否主动处理该预警历史,一种标记用户是否已经知情该报警手段
通知信息:表示该预警历史通知相关信息,点击查看展示具体的通知方式、通知类型、通知组、通知内容(不同通知方式的通知内容)
操作:展示该预警历史其他重要信息,可以点击详情进行查看
1.1.2. 预警规则
功能详述
展示了各个预警类型预警规则,可以动态修改动态生效,启用/禁用规则等
新增
点击新增弹出新增的模态框,说明如下:
- 关联资源:可以选择服务器、应用、其他软件等的群组,实例监控范畴。在没有选择具体的实例(节点)或者群组,那么选择群组或者类型下所有实例、群组都可以生效。比如可以选择mca群组,没有选择具体mca哪个实例。在点击新增之后,NTC会对所有mca实例都创建该预警规则。
- 报警规则:
预警类型:目前支持阈值预警
规则名称:预警规则名称,用户自己命名
预警级别:分为通知、警告、错误、致命。不同的预警级别在预警历史会以不同颜色显示,用户根据实际情况制定级别。
监控项信息:选择监控项和具体监控类型。例如应用CPU监控->系统CPU、应用CPU等
规则描述:选择统计时间段,类型,运算逻辑。比如统计在一分钟内,平均值大于等于阈值
阀值:规则触发的阀值
- 生效方式:
连续超过规则次数:表示多个统计时间内连续触发规则。比如:统计时间段为1分钟,连续超过规则次数为3次,那么表示有连续3分钟都触发了规则。
规则生效开始时间:表示规则生效的开始时间
规则生效结束时间:表示规则生效的结束时间
- 通知方式:
通知类型
默认发送:通知中心会根据用户选择的间隔时间,检查所有预警信息并进行统计,然后进行统一发送通知。默认发送间隔、通知组等配置信息可以至通知中心->通知配置->通知设置,如下图:
实时发送:通知中心会立即发送健康预警信息
通知方式:默认有邮箱、短信,也可以自定义新增其他方式
通知方式设置可以至通知中心->通知配置->设置,如下图:
邮箱服务器配置也在通知中心->通知配置->设置中设置,如下图:
邮件配置:
实时发送配置:分为只发送一次、发送一次再间隔发送、每次都发送
只发送一次:第一次预警的时候发送,之后再次预警也不做发送,一般用于不是很重要的预警消息
发送一次再间隔发送:第一次预警的时候发送,之后再次预警在会在用户选择的时间发送,一般用于中等重要的预警消息
每次都发送:每次预警都发送,一般比较重要的预警消息,要注意预警消息发送会导致邮箱接收过多预警消息情况
通知组:选择要通知预警通知组,可以至通知中心->报警通知人、报警通知组设置
通知备注内容:该内容通知的时候会附带通知
- 预警处理
在预警触发的时候,支持任务。目前支持执行脚本,用户可以在命令脚本输入框写入要执行的shell脚本。
修改
通知中心支持自定义预警规则修改、其他类型预警规则修改请到各自模块修改。修改支持修改规则描述、通知方式等。实时修改实时生效。
禁用、启用、删除
禁用、启用预警规则,删除表示移除预警规则。生效状态不能删除。