2022年站点可靠性工程SRE预测 - blameless


站点可靠性工程 (SRE) 的实践在2022年如何?
 
随着可靠性成为公司运营能力的基础,我们预测 SRE 角色将发挥其真正潜力,而不是受到部分实施的限制。
如果 SRE 目前像机械师一样,在汽车发生碰撞时修理汽车,那么未来 SRE 将变得更像土木工程师,更多地专注于为汽车设计道路。
可靠性始于设计,我们看到可靠性工程师的角色继续参与到最早的阶段,例如架构和原型设计。我们还看到,这个角色的知识库更多地是关于在工作中学习,而不是获得既定的、特定的专业知识。随着工具栈变得更加复杂和专门用于每个团队和目的。
 
SRE 一直是基于用户期望的对齐。我们预测,到 2022 年,组织将对其用户有更深入、更全面的了解。组织不会将用户视为一个单一的实体,而是会深入研究用户拥有的特定体验。
每个用户小组如何使用您的服务,以及他们使用您的服务时什么对他们很重要?查看最终用户的队列将扩展到包括内部角色 :包括 受雇来管理或管理您的服务的人的经验是什么,可靠性对他们意味着什么?
由于这需要贯穿整个组织的可靠性观点,可能会导致创建首席可靠性官职位,这个角色其实已经存在于制造业中。
 
SLO 已成为 SRE 最受认可的方面之一,成为人们关注的焦点。虽然这个概念很受欢迎,但组织仍在弄清楚如何去做。我们预测组织将在新的一年更好地理解 SLO。组织正在对该计划进行更多投资,例如研究用户旅程——我们预计组织将在另一个领域发展——并利用工具来帮助他们跟踪和衡量用户幸福感。随着越来越多的组织开始设想 SLO 的全部潜力,他们也会开始重视支持和告知 SLO 的 SRE 的其他方面。
许多组织认为SLO 是 SRE 的第一步也是最重要的一步,但实际上,每个组织的 SRE 实施顺序可能会有很大差异。