Navigation : 
        
      
    
    
    全覆盖及全链路监视系统
    
    
    
    
概述
BroadLink的服务监视平台由四部分系统构成: 外围探针服务, 监视数据采集和存储系统, 监视分析系统, 通知系统.
- 外围探针服务
- 支持所有类型的产品功能和行为模拟, 可以快速验证系统对一款新产品的支持程度
- 支持端口扫描, 可以快速扫描服务器是否可用, 是否有安全风险
- 支持业务可用性和服务质量探测, 可以快速获取业务服务的可用性和延时数据
 
- 监视数据采集和存储系统
- 低成本获取服务器基础设施信息, 比如CPU, 磁盘的数据
- 低成本获取各业务的所有业务访问数据
 
- 监视分析系统
- 通知系统
BroadLink服务监视平台本身不支持可视化UI,但可以和prometheus+grafana开源组合无缝对接, 同时平台支持独立部署, 可以针对欧洲GDPR的法规要求, 在指定地区独立部署.
服务器基础设施报警
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| CPU | 综合利用率超过固定阈值(默认: 85%) | 邮件和微信 | 自研 | 
| CPU | 趋势报警(指定窗口快速增加) | 邮件和微信 | 自研 | 
| 磁盘 | 使用率超过固定阈值(默认: 85%) | 邮件和微信 | 自研 | 
| 磁盘 | 趋势报警(指定窗口快速增加) | 邮件和微信 | 自研 | 
| 内存 | 使用率超过固定阈值(默认: 85%) | 邮件和微信 | 自研 | 
| 内存 | 趋势报警(指定窗口快速增加) | 邮件和微信 | 自研 | 
| 网络流量 | 使用率超过固定阈值(默认: 85%) | 邮件和微信 | 自研 | 
| 网络流量 | 趋势报警(指定窗口快速增加) | 邮件和微信 | 自研 | 
| 数据库 | 使用率超过固定阈值(默认: 85%) | 邮件和微信 | 自研 | 
| 数据库 | 趋势报警(指定窗口快速增加) | 邮件和微信 | 自研 | 
业务服务指标监视
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| 所有接口QPS(每秒请求量) | 均值, 最大值, 最小值, 最大值超过阈值报警 | 邮件和微信 | 自研 | 
| 所有接口RT(响应时间) | 均值, 最大值, 最小值, 最大值超过阈值报警 | 邮件和微信 | 自研 | 
| 业务接口访问 | 窗口期内无访问, 访问量快速增加, 访问量超过阈值 | 邮件和微信 | 自研 | 
| 业务内部指标 | 出现故障和错误 | 邮件和微信 | 自研 | 
可用性监视
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| APP | 所有接口可用性探测, 不可用报警 | 邮件和微信 | 自研, 多地区探针 | 
| 音箱对接 | 所有接口可用性探测, 不可用报警 | 邮件和微信 | 自研,多地区探针 | 
| 设备 | 所有设备接口可用性探测, 不可用报警 | 邮件和微信 | 自研,多地区探针 | 
| 远程控制 | 不可用报警 | 邮件和微信 | 自研,多地区探针 | 
服务质量监视
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| APP | 所有接口延时超过阈值和不可用报警 | 邮件和微信 | 自研 | 
| 音箱对接 | 所有接口延时超过阈值和不可用报警 | 邮件和微信 | 自研 | 
| 设备 | 所有接口延时超过阈值和不可用报警 | 邮件和微信 | 自研 | 
| 远程控制 | 所有接口延时超过阈值和不可用报警 | 邮件和微信 | 自研 | 
全链路监视
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| APP | APP所有服务链路监视 | 无报警, 数据采集和可视化,快速定位问题 | 自研 | 
| 音箱对接 | 所有云云对接链路监视 | 无报警, 数据采集和可视化,快速定位问题 | 自研 | 
| 设备 | 数据上报链路监视 | 无报警, 数据采集和可视化,快速定位问题 | 自研 | 
系统运营和安全监视
| 监视项目 | 监视内容 | 报警方式 | 监视系统 | 
| 服务器登录密码/证书 | 变更 | 邮件和微信 | 自研 | 
| 服务器端口 | 非指定端口暴露 | 邮件和微信 | 自研 | 
| 网关和业务配置 | 变更 | 邮件和微信 | 自研 |