保持健康的系统

<< Click to Display Table of Contents >>

当前位置:  系统运维 

保持健康的系统

复制链接

1.定期巡检

定期巡检是根据项目/客户的需要,固定时间定期(例如每周或者每双周)对系统的总体情况进行检视,发现风险项并提前处置,避免由于累积下来导致严重的问题。

系统总体情况

监控类别

本期

上期

增量

系统总用户数

 

 

 

报告总数

 

 

 

数据集总数

 

 

 

集市数据集总数

 

 

 

调度任务总数

 

 

 

调度任务总失败数

 

 

 

节点情况

节点资源根据部署不同,会有差异。 总体会包括:访问C节点、集市NMR三类节点、调度C节点(抽数)、ZooKeeper节点、VooltDB节点等。

节点IP

节点类型

License到期时间

服务器内存总量

JVM分配内存总量

磁盘总量

已用磁盘总量

空闲磁盘总量

 

 

 

 

 

 

 

 

注意:

License到期要及时申请更换。

空闲的磁盘空间剩余小于20%或者100G,以及小于一个巡检周期的使用增量时,要及时扩容或者对磁盘空间进行清理。

日活/日均访问量

统计项

统计子项

本期

上期

增量

日活

 

平均日活

 

 

 

最大日活

 

 

 

日报告访问量

平均日访问量

 

 

 

最大日访问量

 

 

 

注:如果访问量或者日活在短期内有显著增加,需要了解原因,判断当前系统是否可支撑,是否需要扩容。

集市数据监控

统计项

本期

上期

增量

集市文件个数

 

 

 

集市文件总大小

 

 

 

集市数据总行数

 

 

 

 

集市行数Top10

本期

上期

行数增量

数据集名称

行数

数据集名称

行数

1

 

 

 

 

 

2

 

 

 

 

 

3

 

 

 

 

 

4

 

 

 

 

 

5

 

 

 

 

 

6

 

 

 

 

 

7

 

 

 

 

 

8

 

 

 

 

 

9

 

 

 

 

 

10

 

 

 

 

 

 

集市大小Top10

本期

上期

存储空间增量(M)

数据集名称

存储空间(M)

数据集名称

存储空间(M)

1

 

 

 

 

 

2

 

 

 

 

 

3

 

 

 

 

 

4

 

 

 

 

 

5

 

 

 

 

 

6

 

 

 

 

 

7

 

 

 

 

 

8

 

 

 

 

 

9

 

 

 

 

 

10

 

 

 

 

 

注意:

显著增长时要进行评估对于数据抽取以及执行方面的影响。

调度任务执行分布

统计项

本期

上期

增量

日均调度任务数

 

 

 

高峰调度任务数

(按小时统计)

 

 

 

调度高峰时段

(按小时)

 

 

 

WebAPI调用情况

统计项

本期

上期

增量

日均调用次数

 

 

 

单日最大调用次数

 

 

 

注意:

如果确定存在webapi调用且频率较高,可以从access.log中搜索bi/api?action进行统计。

防火墙状态,网络,磁盘,CPU,内存

2.健康检查

对于购买了“高级维护升级服务”的售后客户来说,可以通过永洪工单提供提健康检查的需求,我们的售后工程师会对您的BI系统做全面的健康检查。

一般在如下情况下,建议您提健康检查需求:

1)正式上线使用vividime BI产品一年后。

2)使用vividime BI的过程中明显感受到性能有所下降。

3)希望保证产品的稳定运行并及时发现产品的性能隐患可以每半年提一次需求。