
监控告警
文章平均质量分 85
嘉为蓝鲸
与大家分享最新IT研发、运维、运营侧资讯
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
从被动响应到主动预防:WeOps 存储监控的进化之路
当企业需要监控新型号或新品牌的存储设备时,WeOps能够基于设备的指标文档,快速开发定制化监控插件,实现对多样化存储设备的无缝接入与全面监控。原创 2025-03-31 16:33:06 · 317 阅读 · 0 评论 -
小鲸观测助手携手DeepSeek,开启智能告警治理的无限可能
小鲸观测助手通过对告警数据的统计分析,帮助找出那些高频出现的告警,结合内置运维知识库中的最佳实践经验,为运维人员提供针对性的原因分析及优化建议,让原本棘手的告警治理工作变得轻松高效。当告警产生后,小鲸观测助手依托告警中心的辅助分析能力,解析告警对象、告警名称、告警内容等关键信息。在告警治理过程中,面对高频告警、误报以及漏报等难题。以磁盘 I/O 使用率告警这一高频出现的告警为例,能够快速识别出告警数量过多的问题和产生原因,并依托内置的运维知识库的经验,给出告警阈值配置的最佳实践以及相关优化建议。原创 2025-03-11 15:47:56 · 990 阅读 · 0 评论 -
企业级运维监控系统体系化建设指南
监控系统的本质是通过发现故障、解决故障、预防故障来为了保障业务的稳定。而要想在企业内实现监控系统的体系化建设落地,需要从以下三个方面着手建设,分别是监控技术体系、监控指标体系、监控管理体系。原创 2022-09-27 17:11:12 · 970 阅读 · 0 评论 -
企业该如何做好日志管理?
2)蓝鲸平台在腾讯内部业务场景的探索其实刚刚展示的这套日志架构,源自腾讯IEG蓝鲸日志平台的数据流示意图。蓝鲸平台在早期就将日志的各类应用场景作为整个自动化运营中的关键环节,并规划建造出了一套适合中大型企业使用的日志平台。直至目前,蓝鲸日志平台已经历经上百次的迭代,在腾讯内部积累了大量的实践经验,支持了上千项业务的日志需求,总结出了不少技术优化举措,在此结合这个话题进行分享总结。3)关键技术优化举措&经验① 采集端统一Agent,用Agent装采集插件的方式来实现日志采集,便于安装管理。...原创 2022-08-14 14:46:24 · 768 阅读 · 0 评论 -
如何进行日志管理?有好用的日志管理软件吗?
近年来,IT系统逐渐呈现海量化和异构化的趋势,企业每天可能会产生上百GB甚至TB级的日志数据,如何实现日志数据的集中化接入,以及保障日志管理的持续拓展性,成为企业日志管理的一大难点。...原创 2022-08-14 14:43:14 · 832 阅读 · 0 评论 -
智能运维探索:有一种多指标异常检测方案,你可能没用过...
各行业信息化程度迅猛发展的今天,各大企业的信息系统也日趋庞大和复杂。为了保证系统的正常运行,企业的运维人员会通过相应的KPI(Key Performance Indicator, 关键性能指标)对系统进行监控。当某些KPI发生异常时,能够及时发出告警,通知相关人员。一、监控告警系统的数据检测现状现有的监控告警系统大部分采用人工设定规则或阈值的方式来实现。在某些情况下,这些方法确实简单有效,但在中大型业务系统中,我们往往会面临更多的KPI数量,更复杂的KPI间的关联关系,以及更多样性的KP原创 2021-12-24 10:52:07 · 1996 阅读 · 1 评论