9月4日直播|B 站监控架构 2.0 落地实践

B 站原监控架构面临稳定性差、用户查询体验差和云上监控数据质量差等痛点,为此设计了采集存储分离、存算分离的架构,并选用 VictoriaMetrics 作为时序数据库。新架构在数据来源、采集、存储和查询等方面进行了优化。目前新架构:P90 查询耗时降低 10 倍以上,支持 170w+ 采集对象,实现 1-5-10 中的 1 分钟发现,指标告警异常降低 90% 以上,写入吞吐 44M/s,查询吞吐 48k/s,P90 查询耗时降低到 ms 级,成效卓著。
9 月 4 日晚 19:30鲍森乐老师将会在线和大家一起探讨建设监控系统时,遇到的核心痛点及详细的解决策略与方法

直播预告:

  • 分享人:
鲍森乐 资深研发工程师
2021 年加入 B 站,一直负责监控系统架构演进,指标平台迭代,VM 集群稳定性,push 链路等相关工作。完成监控 2.0 架构全面落地,新一代云&边缘监控架构统一,指标 P90 查询耗时降低 10 倍以上。
  • 分享内容概要:
1、面对亿级指标量,B 站如何设计采集存储分离、存算分离架构以解决 Prometheus 频发 00M 问题,并实现资源弹性伸缩?
2、面对稳定性差及查询体验不佳等痛点,B 站如何优化监控架构?
3、在多云和边缘网络环境日益复杂的背景下,B 站怎样实现云上数据的统一管理与整合?
  • 观看方式:
扫描下方二维码即可预约直播
月4日直播|B
  • 合作媒体:

月4日直播|B

本文来自投稿,不代表TakinTalks稳定性技术交流平台立场,如若转载,请联系原作者。

(0)
上一篇 2024年7月18日 上午11:49
下一篇 2024年9月10日 上午10:51

相关推荐

发表评论

邮箱地址不会被公开。