1.1. 服务监控
1.1.1. 功能位置
NTC->服务治理->服务监控
1.1.2. 功能截图
1.1.3. 知识点
说明服务监控数据来自于NTC的报表统计功能,数据存储在Elasticsearch中,数据每分钟更新一次。
1.1.4. 功能详述
服务监控是以服务提供的角度展示服务情况。分为四个标签:服务概览、实例列表、报表历史和报表规则。
服务概览
- 近5分钟流量
时间范围:近5分钟流量就是以服务器时间为标准,往前推5分钟的数据统计,数据的滑动时间窗口单位是秒,所以时间范围是以秒计算往前计算5分钟。数据更新是3秒一次,所以基本上是实时的。如果显示统计开始时间不准确,一般是服务器时间不对或者应用没有推送数据。
数据范围:数据是以实例为单位进行展示
数据内容:
总计:请求总数
成功:请求成功数,非其他状态的请求
拒绝:限流降级导致的请求拒绝
警告:通过探针API设定的某些流程警告
异常:通过探针API设定的某些流程警告或者是请求过程中抛出异常
成功率:成功数量占请求总数的比例
最小:统计时间范围内最小的请求耗时
最大:统计时间范围内最大的请求耗时
平均:统计时间范围内的平均请求耗时
0-30ms,30-300ms....>30s:对应响应时间范围的请求数量
点击一小时统计可以跳转到实例的一小时统计。
- TOP耗时-当天
以今天0点为开始时间,统计今天平均耗时最高的10个实例的交易。
- TOP请求-当天
以今天0点为开始时间,统计今天请求最多的10个实例的交易。
- TOP错误-当天
以今天0点为开始时间,统计今天异常最多的10个实例的交易。
实例列表
实例列表默认展示当天以实例为单位的监控数据。同时每条记录的操作栏有两个按钮,服务详情与24小时统计
- 实例-服务详情
服务详情是展示当前实例,当天的所有交易统计。
- 实例-服务详情-24小时统计
进入当天的服务详情后,对某个交易可以进行以小时为单位的统计展示
- 实例-服务详情-24小时统计-1小时统计
进入以小时为单位的统计后,还可以进入更详细的以5分钟为单位的小时统计。
- 实例-24小时统计
回到首页,除了对实例的服务详情还有实例的24小时统计,24小时是以小时为单位,统计当天实例从0点开始的请求情况。
- 实例-24小时统计-服务详情
实例24小时统计中,还分两个栏展示,第一个就是服务详情,对24小时内的某个小时进行详细的实例小时查看。
- 实例-24小时统计-服务详情-1小时统计
实例服务一小时统计中,还可以对指定服务进行一小时内以5分钟为单位的更详细统计。
- 实例-24小时统计-1小时统计
回到实例24小时统计,还可以进入实例级别更详细的1小时统计,以5分钟为时间单位的统计展示。
- 实例-24小时统计-1小时统计-服务详情
点击1小时实例统计的服务详情可以进入对应5分钟的所有实例详情。
报表历史
报表历史展示的是通过报表规则产生的报表,可根据日期和报表规则的名称进行报表的查询。
- 报表操作
每条记录对应一个报表,每个报表可以预览报表的详细数据。其中实例、交易编号为“——”标识不对该维度进行区分,例如web192168001001实例的交易标号为“——”,则表示这是一条实例级别的汇总数据,不区分交易或者说是汇总了所有交易。数据内为-1的都是不可统计的数据。
对报表记录可以进行下载
对废弃报表可以进行批量删除
报表规则
报表规则是产生报表的途径,设置了正确的报表规则才能产生正确的报表数据。
- 规则新增
点击报表规则页面的新增按钮即可进入规则填写界面。
规则名称:规则的标识,产生报表名称的规则是根据规则名称+触发规则的时间戳。同时产生文件的名称也是如此。所以规则名称的设置最好带有一定的信息,例如:”gateway日报”,”web周报”等。产生报表名称如下
维度分为4种分别是实例交易维度、实例维度、应用交易维度、应用维度
实例交易维度:指以应用、实例、交易作为分类产生报表数据
实例维度:指以应用、实例作为分类,不区分交易进行数据产生
应用交易维度:指以应用、交易作为分类,不区分具体实例进行数据产生
应用维度:指以应用为分类,不区分实例、交易进行数据产生
需要报表包含哪类维度的数据,就将哪类维度勾选。例如我需要每个实例每个交易的统计信息,同时需要对每个实例做一个交易汇总,那我在规则中就需要实例交易和实例两个维度的数据。再例如我需要应用每个实例的汇总数据,同时又需要应用中所有实例的数据汇总,那就需要选中实例和应用维度。
统计方式目前有四种:按日统计、按月统计、按季度统计、按年统计,按日统计即按照每天的方式进行报表统计展示,例如按日报表的时间会精确到每天的时期。按月统计报表时间的精度只会精确到月,以此类推,按季度统计时间精确到季度,按年统计时间精确到年。统计只与数据展示时间的类型有关,与统计的范围无关。
时间类型和统计时间两个参数相关,选择的时间类型为固定时间时,统计时间仅统计固定写死的时间范围内的数据。而当时间类型为相对时间时,时间范围可以选为一天时间前的时间范围统计,这个时间范围是根据何时执行该统计来计算的。
注意需要注意的是前1月不是说30天前的所有数据,而是说假如今天为11月3号,统计数据的范围为10月整个月份,前2月指的就是9、10月两个月份的统计数据,而当统计范围的单位为季度时,前一个季度指的就是上一个季度的时间范围。单位为年时以此类推。
规则类型分为两种:单次执行、Cron任务。单次执行意味着不会定时执行,只能通过手动在页面点击执行按钮来生成报告,多用于想计算固定时间的一个报表统计。Cron任务意味着通过Cron表达式来决定规则执行的时间,选择Cron任务时多于相对时间做搭配,例如设置执行时间为每个月的1号,然后统计前1月的数据,一次产生上个月月报。
条件筛选:是可以对某些符合条件的交易才进行统计,分为三种条件,应用、实例、交易名,每种条件都只能出现一次,每种条件都是包含方式。其中应用是必选的条件
是否发送邮件:在规则每次执行时,是否直接将报表产生文件并发送。开启时需要选中联系组,同时也要确保通知中心->预警通知中的邮件通知配置生效。
- 其他操作
点击修改按钮可以进行规则的修改,修改的规则与新增相同。
点击删除按钮可以进行规则的删除。
点击执行按钮则可以进行规则的单次执行,不管是单次任务还是Cron任务都可以进行单次执行。