「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?
  • 活动时间: 2022年7月16日,14:00-17:00
  • 活动地点:线上直播(infoQ视频号线上直播、B站直播间)
  • 进群方式:扫码添加小树,回复「沙龙」进群
「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?

故障专题

程序员不能被同一原因的故障坑两次”——程序员的自我修养

移动互联网时代,业务场景多元、玩法多样瞬时流量高,系统的复杂度也越来越高。一次故障就是一次考试。不管你是研发、测试、运维,或其他“工种”,只要你身处IT行业,「故障」怕都是大家避之唯恐不及却无法绕开的一个梦魇和话题。

本次「TakinTalks」技术分享会:将会通过互联网典型故障事件出发,剖析故障成因,介绍治理实践经验和技术演进,并为如何做好故障复盘提供一定的参考,帮助大家可以更从容淡定、有章可循地做好系统稳定性建设。

嘉宾与分享主题

@武安闯 -bilibili·在线SRE负责人

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?
  • 嘉宾介绍:

B站基础架构部在线业务SRE负责人。2016年加入B站,深度参与B站微服务拆分、云原生改造、高可用建设、SRE转型和稳定性体系落地等项目。当前主要关注B站在线业务的SRE稳定性体系建设和推广,对SRE的实践有深入的探索与思考。

  • 分享主题:

《B站”713事故“后的多活容灾建设优化》

  • 听众收益:

介绍常见的故障类型和解决方案(追加:B站大型活动中的踩坑实践分享),及B站的多活基架能力优化和多活切量预案平台建设。

  • 适合人群:

SRE工程师、研发、架构师等


@李道兵 -奈雪的茶·技术中心高级总监

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?
  • 嘉宾介绍:

李道兵,奈雪的茶技术中心高级总监。先后在金山、盛大云、七牛云、京东云等公司工作。曾任盛大云资深研究员,七牛云SVP兼首席架构师、京东云高级总监。现主要关注连锁经营和供应链的产业互联网领域。

  • 分享主题:

《事故报告与事故复盘:不要浪费掉任何一次危机》

  • 听众收益:

每次事故,都会有事故报告和事故复盘的过程,如果不明晰这些流程的目的,那么这些流程就会流于形式,也丧失了通过事故来改进系统的机会,沦为简单的头疼医头,脚疼医脚的境地。

本次分享,将从实际工作经历出发,结合具体案例,向大家阐述我自己对事故报告、事故复盘的看法。

适合人群: 

  • 架构师
  • 技术团队负责人

主办方_ TakinTalks

「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。

  • 聚焦SRE稳定性领域
  • 与业界TOP技术专家近距离交流
  • 与3000+同行探讨技术经验

合作伙伴_ bilibili技术

哔哩哔哩技术公众号会囊括B站技术相关的硬核分享,也有技术团队的招聘信息,你想看的技术内容都在这里。

合作媒体:

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?

报名活动,超多福利奖品大放送

「TakinTalks」_ 故障频繁发生,如何做好系统稳定性?

发布者:TT,转载请注明出处:数列科技

(3)

相关推荐

发表回复

登录后才能评论

评论列表(1条)