产品名称:主机监控系统
厂商自带的监控服务可用于收集获取云资源的监控指标或自定义的监控指标,探测服务可用性,以及针对指标设置警报。能让我们快速全面的了解云资源使用情况、业务的运行状况和健康度,并及时收到异常报警做出反应,保证应用程序顺畅运行。但是云厂商提供的监控存在诸如监控项过少、监控数据丢失、监控频率过低等问题。
我们的云主机监控系统基于Prometheus内核,实现了对多家云厂商(阿里云、腾讯云、华为云、AWS等)多种云主机的集中监控及管理,采集指标丰富,配置多种图形化的展示方式。
产品功能
1. 实时监控及展示云主机性能指标;
2. 云主机监控指标异常及告警功能;
3. 自定义监控项,采集的监控数据上报到云监控,云监控对其提供监控图表和报警功能;
4. 云主机容量性能监控及预测功能。
技术特色:
1. 不依赖于分布式存储,可以建立独立的单服务器节点;
2. 图形和仪表板支持多种模式;
3. 基于Exporter的机制进行采集Agent的开发和部署;
4. 采用时序数据库存储和处理采集的监测数据,数据查询速度远快于普通数据库;
5. 支持分布式多节点数据库集群,扩展非常方便。
产品价值:
1. 通过监控云服务器的CPU使用率、内存使用率、磁盘使用率等基础指标,确保主机的正常使用;
2. 在监控数据达到报警阈值时发送报警通知,让用户及时获取异常通知,查询异常原因,并对异常进行处理;
3. 监控项不能满足需求,可以根据用户所需自定义监控项;
4. 对带宽、连接数、磁盘使用率等监控项设置报警规则后,便于用户及时了解云主机现状。在业务量变大后,用户可以及时收到报警通知,对云主机进行扩容。