去哪儿旅行因应酒店订单激增,需提升故障预警能力。现有监控系统watcher仅提供分钟级数据,导致故障发现延迟,影响订单赔付和品牌信任。为减少订单损失,迫切需要实现秒级监控精度。
11月20日晚 19:30,梁成琰和李越老师将会在线和大家一起探讨去哪儿网通过秒级监控预警,将故障发现时长从4分钟降至1分钟内,显著提升了故障响应速度。核心业务指标如订单量、交易失败率等实现秒级监控,故障1分钟发现率和预警准确率稳步提升。
直播预告:
分享人:
梁成琰 去哪儿网资深devops工程师
李越 去哪儿网资深测试工程师
内容亮点:
1、去哪儿网是如何实现从分钟级到秒级监控预警的精度提升的?
2、在秒级监控预警落地实践中,去哪儿网是如何解决存储IO过高和占用空间过大的问题的?
3、与分钟级监控相比,去哪儿旅行的秒级监控预警系统是如何将故障发现时长从4分钟缩短至1分钟内的?
观看方式:
扫描下方二维码即可预约直播
合作媒体:
本文来自投稿,不代表TakinTalks稳定性技术交流平台立场,如若转载,请联系原作者。