Netflix 如何预热缓存?利用EBS移动PB级数据


EVCache是一种基于 memcached 的分布式内存缓存解决方案。它是 Netflix 的一个 Tier-0 系统,其足迹遍布约 18,000 台服务器,拥有约 14 PB 的数据,并且仍在快速增长。
我们之前已经概述了我们如何在 EVCache 集群上执行缓存 预热以及为什么需要它。最初的缓存预热文章中提到的架构对于我们的绝大多数用例都非常有效。然而,随着 Netflix 用户群多年来的增长,存储在 EVCache 中的数据占用量增加了数倍,并将继续增加以满足新的和额外的需求。随着集群规模和敏感性的增加,架构需要不断发展以跟上。
在这篇文章中,我们将讨论遇到的各种瓶颈,并通过解决我们面临的瓶颈,提出一种具有更高吞吐量的改进架构,适用于 PB 级数据集。我们将分享我们生产环境的结果,这些结果表明,与我们之前的架构相比,我们的总预热时间减少了约 90%。
我们很高兴将这个项目的 memcached dumper 部分开源,以供更广泛的社区使用,称为Cachemover,它允许人们尽快将 memcached 数据转储到磁盘。
原文点击标题