沙龙时间:
2023年2月25日 14:00-17:00
沙龙地点:
线上直播(infoQ视频号、51CTO视频号、TakinTalks-B站直播间)
进群方式:
扫码添加助理小姐姐,回复「沙龙」进群
课件获取方式:
关注“TakinTalks稳定性社区“公众号,回复“2251”、“2252”
👏👏👏福利待你解锁:
扫码添加助理小姐姐,回复「福利」,积极参与活动互动,即可获取书籍《SRE原理与实践:构建高可靠性互联网应用》一本。
高峰流量场景实践之——「可观测与容量管理」专题
嘉宾与分享主题
@张观石 –《SRE原理与实践:构建高可靠性互联网应用》作者
嘉宾介绍:
资深运维专家和架构师,拥有20年软件开发、架构、运维、SRE经验。历任项目研发负责人、SRE负责人、架构师,事故管理委员会委员、基础保障部架构师委员会委员。
为虎牙基于微服务架构的直播业务、音视频业务、海外直播业务建立了稳定的保障体系,多次担任虎牙“英雄联盟全球总决赛直播”稳定性保障负责人。在混合多云架构、可观测性、预案、变更管控、AIOps等SRE领域有深入研究和丰富经验。
同时,他也是中国信通院分布式系统稳定性实验室高级技术专家,参与编写了信通院《信息系统稳定性保障能力建设指南》。《运维前线》一书的联合作者。多次参与GOPS、MSUP、GDevops技术大会分享。
分享主题:
《SRE可观测能力:故障的感知、定位和快恢》
议题概要:
1、以虎牙为例,监控观测技术发展有哪几个阶段?有哪些技术要点?
2、可观测能力在故障生命周期中发挥什么作用?
3、实践案例:虎牙可观测能力介绍及亮点成效
听众收益:
1、能了解可观测性的相关知识、重要性;
2、学习到如何通过SRE观测能力来感知互联网平台的故障,加快发现定位和修复决策;
适合人群:
运维工程师、系统架构师、软件开发工程师
嘉宾与分享主题
@张鹤 –哔哩哔哩 资深SRE专家
嘉宾介绍:
2020年加入B站,先后负责主站/直播/OGV/推广搜相关的SRE工作,深度参与多活,活动保障,混沌工程,容量治理相关的建设,主导容量管理平台,混沌平台的架构设计和落地,负责B站S赛、跨年晚会、拜年祭等相关活动的基础架构保障工作,目前主要负责推广搜业务的稳定性建设。
分享主题:
《容量管理之可视化运营》
议题概要:
随着近几年降本增效的大背景,以及k8s云原生的普及,容量资源的可视化显得尤为重要,本次分享重点介绍B站如何落地容量管理,以及基于容量数据赋能业务。
听众收益:
1、如何构建一套容量可观测体系?
2、如何整合碎片化资源,为业务保驾护航?
3、降本增效的大背景下,B站的容量管理都遇到哪些问题,是如何解决的?
适合人群:
SRE工程师、研发、架构师,测试等
主办方_「TakinTalks」
「TakinTalks」是联合业界专家共同发起的稳定性技术交流平台,面向技术管理者与一线技术专家,定期探讨行业前沿技术,分享最佳实战经验。让技术知识的传播没有界限。
- 聚焦SRE稳定性领域
- 与业界TOP技术专家近距离交流
- 与3000+同行探讨技术经验
合作媒体
本文来自投稿,不代表TakinTalks稳定性技术交流平台立场,如若转载,请联系原作者。