高可用性

     

使用 Nginx 缓存代理使您的后端更可靠

1100 3K

我们大多数人都熟悉 Nginx——它是一个非常流行的 Web 服务器和反向代理。但是您知道您也可以将它用作缓存代理吗?现在,您可能想知道为什么有人想做这样的事情——您不能更新您的服务以在 Redis .

系统架构10大架构特征 - zonito

2133 4K

想象一下你正在买一辆车。您需要其中的哪些基本功能?车辆应该将人从 A 点运送到 B 点。但我们还要检查的是安全性、舒适性、可维护性、易于维修或更好的里程。您也可以寻找电动版本或更快的速度。为什么?为了.

Java出现一个新的GC:​​​​​​​LXR

1307 1

LXR是一种基于引用计数的新 Java 垃圾收集器,一种新的低延迟、高吞吐量的垃圾回收器。该文在OpenJDK 11(当时的LTS)中构建了LXR,与现有G1、Shenandoah和ZGC等回收器进行.

Twitter构建高度可靠的广告投放系统的经验教训

531

在设计、实施和运营起广告投放系统的两年中,我们学到了一些值得分享的东西:首先,不可能为所有故障设计服务并为耗尽而设计。在容错的复杂性和各种故障的可能性之间找到平衡是很重要的。例如,为了达到所需的 SL.

有史以来最长的Atlassian停机 - Gergely

794 3K

我们正处于Atlassian有史以来最长的一次中断中。近400家公司和5万至80万用户无法访问JIRA、Confluence、OpsGenie、JIRA状态页面和其他Atlassian云服务。这次中断.

大规模分布式系统中的级联故障 - stuttgart

1439 2K
对谷歌、亚马逊和 Co.等公司来说服务的可靠运行非常重要,但它们的系统一次又一次地出现故障,导致大量中断和糟糕的客户体验。人们经常会遇到所谓的级联 故障,导致超出普通系统故障的不良并发症。即使是在线业.

如何分片数据库? - stackoverflow

909 1 5K

分片是解决网络应用发展带来的新挑战的方法之一。其他解决方案包括 DBaaS(或云中的数据库)、新的数据库架构,或者只是增加用于存储的数据库数量的老式方法。 随着智能手机的出现,应用程序将我们消耗和产生.

最大个人直播平台Twitch如何实现99.99%高可用性?

1073 1 5K

Twitch是世界上最大的个人流媒体直播平台,客户端观看Twitch的方式有很多,包括桌面浏览器、移动设备、游戏机和电视应用程序。客户端交付平台团队拥有向用户交付Twitch客户端的基础设施。去年,我.

解耦事务:在抖动的SQL服务器上实现低尾延迟在线事务 (CIDR 2022)

1240 1 2K
这是Pat Helland 的论文:Pat Helland 的 CIDR22 论文,Pat的论文总是非凡的、与众不同的。他们有很多智慧。 问题和范围抖动是指最大延迟与最小延迟的时间差,如最大延迟是20.

在分布式系统中通过客户端库包提高可用性

918 4K

在客户端应用程序中设置一个库,我们可以一致地处理故障,从而提高系统的感知可用性。在开发在我们自己的公司内部或外部使用的 API 时,除了记录和公开端点之外,我们还可以选择交付客户端库。这种方法对用户有.

2022年站点可靠性工程SRE预测 - blameless

943

站点可靠性工程 (SRE) 的实践在2022年如何? 随着可靠性成为公司运营能力的基础,我们预测 SRE 角色将发挥其真正潜力,而不是受到部分实施的限制。如果 SRE 目前像机械师一样,在汽车发生碰撞.

亚马逊对2022年以后的云计算技术预测

1600 1 2K

我们已经到了一个拐点:在亚马逊 AWS十五年前率先推出云技术之后,云基础设施已经发展到我们可以看到云的所有部分几乎可以到达地球上的任何地方,甚至可以到达太空。云让曾经的科幻小说变成了科学事实。人工智能.

如何编写幂等的 Bash 脚本?- Arslan

875 3K

您编写了一个 bash 脚本,但由于错误而中途退出,您修复系统中的错误并再次运行脚本。但是脚本中的一半步骤会立即失败,因为它们已经应用于您的系统。要构建弹性系统,您需要编写幂等的软件。 什么是幂等性?.

Honeycomb使用Apache Kafka为数据摄取提供高可用性缓冲管道

1090 3K

当您将遥测数据发送到 Honeycomb 时,Honeycomb 的基础架构需要先缓冲您的数据,然后再在我们的“检索器”列式存储数据库中进行处理。在 Honeycomb 的整个存在过程中,我们一直使用.

配置Apache Kafka生产者参数以获得高可用性和弹性 - Nabraj

1116 4K
Apache kafka以其弹性、容错性和高吞吐量而闻名。但它的表现并不总是满足所有人的期望。在某些情况下,我们可以通过缩小或扩大代理规模来改进它。而在大多数情况下,我们必须玩配置游戏。在卡夫卡的生态.