PayPal如何将Teradata数据仓库迁移到BigQuery实现产品分析


自全球大流行开始以来,PayPal 经历了创纪录的增长,这给用于合规、风险处理、产品和财务分析、营销、客户成功和欺诈保护的离线分析系统带来了很大压力,这些分析系统都在本地数据中心。这些系统由 Teradata 和 Hadoop 作为核心提供支持,并配备了额外的软件和工作流来管理这些系统中的资源。
为了跟上增长的需求,我们决定将 PayPal 分析平台迁移到公共云。仓库工作负载首次大规模迁移到 Google Cloud 中的 BigQuery 用时不到一年。在此过程中,PayPal 团队构建了一个平台,该平台也将支持许多其他用例。
BigQuery 使我们能够集中我们的数据平台,而不会失去 SQL 访问、Spark 集成和高级 ML 训练等功能。此外,BigQuery 还具有一些高级功能,例如 ML 和实时分析,无需将数据移出另一个系统即可利用这些功能。
这篇文章记录了一个里程碑式的迁移体验。我们将一半的数据和处理从 Teradata 系统迁移到 Google Cloud Platform 的 BigQuery。
点击标题见原文