-
交易中台系统稳定性建设之路
一、前言 交易中台,作为微盟新商业操作系统 WOS 的核心中台之一,前承消费者选择商品,后接消费者下单支付,是消费者线上购物通道中,搭配优惠,计算价格,配送履约,支付下单的必须环节…
-
从流量打标到机器打标 – 达达全链路压测探索与实战
1. 背景 2. 全链路压测 核心设计 2.1 业界全链路压测 2.2 达达全链路压测 2.3 压测平台 3. 全链路压测 落地 3.1 链路梳理 3.2 优化预案设定 3.3 精…
-
哈啰出行高质量故障复盘法:“3+5+3”(附模板)
# 一分钟精华速览 # 故障复盘指的是及时把过去发生的错误,最大程度转化为未来可以规避的办法,其核心是不断减少失败因子繁衍的温床,将它们牢牢地掌控在不至于引发危机的范围之中。 作为…
-
团队新人多,稳定性经验不足,研发质量怎么保障?|TakinTalks论道
本文来源于 TakinTalks 稳定性社区「年度专家小会·杭州站」,由酷家乐、飞书、婚礼纪、浙江华为、阿里云的 5 位不同角色的稳定性管理者分享。
-
去哪儿是如何做到大规模故障演练的?
如果说能力建设是从0-1,那么从1-100的大规模自动化演练又是怎么进行的?
-
美图是如何搭建压测监控一体化平台的?
美图架构平台团队的主要工作,是给业务提供技术支撑,保障业务的稳定性;在减少故障方面,架构团队和 SRE 团队有比较紧密的配合和较多的实践。此前美图 SRE 团队也在 TakinTa…
-
去哪儿的常态化容量是怎么做的?|TakinTalks稳定性社区
大多数时候,我们聊的都是“双十一”等大型活动下的容量保障,但除了个别典型峰值场景外,系统日常也会有各类容量保障的需求,去哪儿网作为国内最大的旅行平台之一,在各类场景中摸索出了一套常…
-
故障复盘究竟怎么做?美图SRE结合10年经验做了三大总结(附模板)
美图崇尚的故障文化是 “拥抱故障,卓越运维”,倡导的基准是 No-Blame, 即「不指责,重改进」。今年 9 月 TakinTalks 社区曾经分享过美图的三段式故障治理方法(美…
-
如何避免这10类常见故障?B站数据库架构设计做了这5步……
今年 3 月 GitHub 在一周内出现了多次服务不可用的情况,每起事件持续时长在 2-5 小时,据有媒体统计,GitHub 在一周中多次中断影响的开发者数量高达 7300 万。事…
-
kafka压测造数,数据集要怎么使用?
快速下载: 通用版本:kafka-data_set-pump.jar 密码:cuah kafka集群0.8.2.x版本:kafka-pump-0.8.2.x.jar 密码:QUz7…