2024年五本最佳平台工程书籍


平台策略、团队拓扑、IaC、SRE、指标等等!

Syntasso 团队经常在会议、社交媒体和 Slack DM 上被要求推荐平台工程书籍。团队内部通常对最佳平台工程书籍有很多共识,但排名可能会引起争议!我们汇集了这篇博文的五大推荐。

以下是我们推荐的 2024 年五大平台工程书籍(无特定顺序)!

1、平台战略:协调创新
格雷戈尔·霍佩
本书提供了设计和实施可扩展平台的全面指南,该平台可以适应企业环境中运营不可避免的不断增长的需求(和变更请求)。

Gregor 是一位经验丰富的软件和平台架构师。在这本书中,他深入探讨了构建高效支持多种产品和服务的平台的战略和实践方面。关键概念包括架构决策、治理模型以及平衡标准化和创新的挑战。

这本书对于平台工程师来说至关重要,因为它可以帮助他们了解架构选择如何支撑成功的平台战略。这有助于促进更好的决策,并实现强大、可扩展的基础架构。对于那些希望将技术战略与更广泛的业务目标相结合的人来说,这本书特别有用,这本书来自 Gregor 的另一本优秀著作《软件架构师电梯》。

2、团队拓扑:组织业务和技术团队实现快速流动
作者:Matthew Skelton 和 Manuel Pais
《团队拓扑》提供了一种实用的、基于模型的方法来组织软件开发中的团队。本书的策略侧重于创建团队互动,以促进更快的软件交付并在企业内构建更具凝聚力的系统。源自本书的“流程一致团队”、“支持团队”、“复杂子系统团队”和“平台团队”等语言现在已成为初创企业和企业的主流。

对于平台工程师来说,了解这些动态对于设计能够有效管理和发展支持其业务的技术平台的团队至关重要。对于任何希望改进团队结构以提高软件交付速度和质量的人来说,这都是一份极好的资源。

3、基础设施即代码:云时代的动态系统
作者:Kief Morris
本书对于理解通过代码管理和配置基础设施的原则和实践至关重要。Kief Morris 探讨了如何使用云技术将物理服务器、虚拟机和其他基础设施元素视为软件实体,从而实现自动化设置、配置和维护。他提供了使用流行工具和框架在堆栈的所有级别实现基础设施即代码 (IaC) 的实用建议。

本书是希望掌握基础设施自动化的平台工程师的必读书籍,这对于创建高效、可扩展且稳定的软件交付管道和环境至关重要。对于任何创建、扩展或管理基于云的基础设施的人来说,它都是不可或缺的资源。

4、站点可靠性工程:Google 如何运行生产系统
作者:Betsy Beyer、Jennifer Petoff、Chris Jones 和 Niall Richard Murphy
本书介绍了 Google 开创性的站点可靠性工程 (SRE)方法,该方法将软件工程与 IT 运营任务相结合,以创建高度可靠和自动化的系统。本书汇集了多位 Google 工程师撰写的论文和文章,为构建和维护能够处理数百万用户和巨大计算工作量的系统提供了现实见解。本书涵盖的主题包括自动化、监控、可扩展性设计、配置管理和灾难响应。

平台工程师会发现这本书对于理解如何将软件工程原理应用于运营挑战以及学习如何提高系统可靠性和运营效率非常有价值。

5、加速:建立和扩大高绩效技术组织
作者:Nicole Forsgren、Jez Humble 和 Gene Kim
本书以研究为基础,探讨了 DevOps 实践如何影响高绩效技术组织。它探讨了影响软件交付绩效和组织文化的能力,这些能力对于有效的平台工程至关重要。Forsgren 博士及其团队的工作现已演变为DORA 团队的年度出版物“ DevOps 加速状态报告”。

Accelerate 的见解将帮助平台工程师了解如何实施推动更快、更可靠地交付软件和服务的实践。