-
蚂蚁集团:Apache HoraeDB时序数据库性能提升2-4倍是如何做到的?
# 一分钟精华速览 # 在蚂蚁集团内部孵化的 HoraeDB(已开源) ,能成功应对当前主流数据库在高基数时序场景下所遭遇的性能挑战。这些挑战包括在数据量极大时性能的严重下降,以及…
-
1万+数据库实例:多点DMALL如何通过TopSQL提升MySQL性能观测效率?
# 一分钟精华速览 # 多点 DMALL 的数据库规模庞大,有数千个集群,实例数量超过了 10000,另外,DBA 团队要支撑千人规模研发人员的各类数据库需求,其中以 SQL 性能…
-
日志资源成本减少35%:新东方可观测体系改造如何降本增效?
# 一分钟精华速览 # 在双减政策影响下,新东方面临业务缩减和资源紧张的局面,迫切需要技术调整和优化以应对成本压力并提高效率。面对人手减少、技术标准化不足和技术栈复杂等挑战,公司制…
-
Prometheus+Grafana:转转如何打造开箱即用的一体化监控系统?
# 一分钟精华速览 # 面对业务侧和架构侧的双重“降本+提效”需求,转转结合自家业务的特性进行二次开发,构建出一套集业务服务、架构中间件、运维资源于一体的立体式监控平台。转转借此平…
-
“1-5-15”原则:中国联通数字化监控平台可观测稳定性保障实践
# 一分钟精华速览 # “只知道系统有问题,但是找不到问题到底出在哪里”,这几乎是大家都面临过、或正在面临的问题。用户在投诉,但是我的指标都是正常的,到底是哪一环出问题了? 本文详…
-
2023九月 字节 质量保障-技术风险团队招聘
质量保障-技术风险团队专注于业务稳定
性方向,支持字节跳动产品多个业务,以
MTTR为目标提升线上质量水位。我们致力于成为一支专业的稳定性团队,目前重点支持业务提升事故发现、诊断、止损能力,主要工作方向有监控治理、攻防演练;事故预设、应急工具、诊断定位等能力建设。 -
保险业务连续性保障:从测试到生产,混沌平台建设节奏如何把控?
一分钟精华速览 中国信通院最新的调查报告显示,越来越多企业正在尝试通过混沌工程来提高系统稳定性。实验的不同阶段,大家面临着不同的问题,我们尝试从混沌工程推进的不同角度,为大家提供一…
-
如何减少创建订单、支付等线上写场景漏测?去哪儿流量录制回放实践
本文以去哪儿网为例,介绍流量录制与回放实践,探讨其在接口自动化测试和全链路压测中的应用成效。
-
如何在金融企业推进故障演练?中国人寿分阶段实践总结
本文介绍了中国人寿故障演练的项目背景、目标思路、技术方案等,分享其在预知故障和降低不确定性风险方面的实践成效。
-
系统日志规范及最佳实践
这是2023年的第35篇文章 ( 本文阅读时间:10分钟 ) 打印日志是一门艺术,日志信息是开发人员排查线上问题最主要的手段之一,但规范打日志被开发同学经常所忽视。日志就像保险,平…