1.1. 服务监控

1.1.1. 功能位置

NTC->服务治理->服务监控

1.1.2. 功能截图

1.1.3. 知识点

说明服务监控数据来自于NTC的报表统计功能,数据存储在Elasticsearch中,数据每分钟更新一次。

1.1.4. 功能详述

服务监控是以服务提供的角度展示服务情况。分为四个标签:服务概览、实例列表、报表历史和报表规则。

服务概览

  • 近5分钟流量

时间范围:近5分钟流量就是以服务器时间为标准,往前推5分钟的数据统计,数据的滑动时间窗口单位是秒,所以时间范围是以秒计算往前计算5分钟。数据更新是3秒一次,所以基本上是实时的。如果显示统计开始时间不准确,一般是服务器时间不对或者应用没有推送数据。

数据范围:数据是以实例为单位进行展示

数据内容:

总计:请求总数

成功:请求成功数,非其他状态的请求

拒绝:限流降级导致的请求拒绝

警告:通过探针API设定的某些流程警告

异常:通过探针API设定的某些流程警告或者是请求过程中抛出异常

成功率:成功数量占请求总数的比例

最小:统计时间范围内最小的请求耗时

最大:统计时间范围内最大的请求耗时

平均:统计时间范围内的平均请求耗时

0-30ms,30-300ms....>30s:对应响应时间范围的请求数量

点击一小时统计可以跳转到实例的一小时统计。

  • TOP耗时-当天

以今天0点为开始时间,统计今天平均耗时最高的10个实例的交易。

  • TOP请求-当天

以今天0点为开始时间,统计今天请求最多的10个实例的交易。

  • TOP错误-当天

以今天0点为开始时间,统计今天异常最多的10个实例的交易。

实例列表

实例列表默认展示当天以实例为单位的监控数据。同时每条记录的操作栏有两个按钮,服务详情与24小时统计

  • 实例-服务详情

服务详情是展示当前实例,当天的所有交易统计。

  • 实例-服务详情-24小时统计

进入当天的服务详情后,对某个交易可以进行以小时为单位的统计展示

  • 实例-服务详情-24小时统计-1小时统计

进入以小时为单位的统计后,还可以进入更详细的以5分钟为单位的小时统计。

  • 实例-24小时统计

回到首页,除了对实例的服务详情还有实例的24小时统计,24小时是以小时为单位,统计当天实例从0点开始的请求情况。

  • 实例-24小时统计-服务详情

实例24小时统计中,还分两个栏展示,第一个就是服务详情,对24小时内的某个小时进行详细的实例小时查看。

  • 实例-24小时统计-服务详情-1小时统计

实例服务一小时统计中,还可以对指定服务进行一小时内以5分钟为单位的更详细统计。

  • 实例-24小时统计-1小时统计

回到实例24小时统计,还可以进入实例级别更详细的1小时统计,以5分钟为时间单位的统计展示。

  • 实例-24小时统计-1小时统计-服务详情

点击1小时实例统计的服务详情可以进入对应5分钟的所有实例详情。

报表历史

报表历史展示的是通过报表规则产生的报表,可根据日期和报表规则的名称进行报表的查询。

  • 报表操作

每条记录对应一个报表,每个报表可以预览报表的详细数据。其中实例、交易编号为“——”标识不对该维度进行区分,例如web192168001001实例的交易标号为“——”,则表示这是一条实例级别的汇总数据,不区分交易或者说是汇总了所有交易。数据内为-1的都是不可统计的数据。

对报表记录可以进行下载

对废弃报表可以进行批量删除

报表规则

报表规则是产生报表的途径,设置了正确的报表规则才能产生正确的报表数据。

  • 规则新增

点击报表规则页面的新增按钮即可进入规则填写界面。

规则名称:规则的标识,产生报表名称的规则是根据规则名称+触发规则的时间戳。同时产生文件的名称也是如此。所以规则名称的设置最好带有一定的信息,例如:”gateway日报”,”web周报”等。产生报表名称如下

维度分为4种分别是实例交易维度、实例维度、应用交易维度、应用维度

实例交易维度:指以应用、实例、交易作为分类产生报表数据

实例维度:指以应用、实例作为分类,不区分交易进行数据产生

应用交易维度:指以应用、交易作为分类,不区分具体实例进行数据产生

应用维度:指以应用为分类,不区分实例、交易进行数据产生

需要报表包含哪类维度的数据,就将哪类维度勾选。例如我需要每个实例每个交易的统计信息,同时需要对每个实例做一个交易汇总,那我在规则中就需要实例交易和实例两个维度的数据。再例如我需要应用每个实例的汇总数据,同时又需要应用中所有实例的数据汇总,那就需要选中实例和应用维度。

统计方式目前有四种:按日统计、按月统计、按季度统计、按年统计,按日统计即按照每天的方式进行报表统计展示,例如按日报表的时间会精确到每天的时期。按月统计报表时间的精度只会精确到月,以此类推,按季度统计时间精确到季度,按年统计时间精确到年。统计只与数据展示时间的类型有关,与统计的范围无关。

时间类型和统计时间两个参数相关,选择的时间类型为固定时间时,统计时间仅统计固定写死的时间范围内的数据。而当时间类型为相对时间时,时间范围可以选为一天时间前的时间范围统计,这个时间范围是根据何时执行该统计来计算的。

注意需要注意的是前1月不是说30天前的所有数据,而是说假如今天为11月3号,统计数据的范围为10月整个月份,前2月指的就是9、10月两个月份的统计数据,而当统计范围的单位为季度时,前一个季度指的就是上一个季度的时间范围。单位为年时以此类推。

规则类型分为两种:单次执行、Cron任务。单次执行意味着不会定时执行,只能通过手动在页面点击执行按钮来生成报告,多用于想计算固定时间的一个报表统计。Cron任务意味着通过Cron表达式来决定规则执行的时间,选择Cron任务时多于相对时间做搭配,例如设置执行时间为每个月的1号,然后统计前1月的数据,一次产生上个月月报。

条件筛选:是可以对某些符合条件的交易才进行统计,分为三种条件,应用、实例、交易名,每种条件都只能出现一次,每种条件都是包含方式。其中应用是必选的条件

是否发送邮件:在规则每次执行时,是否直接将报表产生文件并发送。开启时需要选中联系组,同时也要确保通知中心->预警通知中的邮件通知配置生效。

  • 其他操作

点击修改按钮可以进行规则的修改,修改的规则与新增相同。

点击删除按钮可以进行规则的删除。

点击执行按钮则可以进行规则的单次执行,不管是单次任务还是Cron任务都可以进行单次执行。

results matching ""

    No results matching ""